【每日算法】数据结构运用模拟题（双栈表达式计算的简化版）

来源：互联网收集：自由互联发布时间：2022-06-15

题目描述这是 LeetCode 上的 726. 原子的数量，难度为困难。 Tag : 「模拟」、「数据结构运用」、「栈」、「哈希表」、「优先队列」给定一个化学式 formula（作为字

题目描述

这是 LeetCode 上的 726. 原子的数量，难度为困难。

Tag : 「模拟」、「数据结构运用」、「栈」、「哈希表」、「优先队列」

给定一个化学式 formula（作为字符串），返回每种原子的数量。

原子总是以一个大写字母开始，接着跟随0个或任意个小写字母，表示原子的名字。

如果数量大于 1，原子后会跟着数字表示原子的数量。如果数量等于 1 则不会跟数字。例如，H2O 和 H2O2 是可行的，但 H1O2 这个表达是不可行的。

两个化学式连在一起是新的化学式。例如 H2O2He3Mg4 也是化学式。

一个括号中的化学式和数字（可选择性添加）也是化学式。例如 (H2O2) 和 (H2O2)3 是化学式。

给定一个化学式，输出所有原子的数量。格式为：第一个（按字典序）原子的名子，跟着它的数量（如果数量大于 1），然后是第二个原子的名字（按字典序），跟着它的数量（如果数量大于 1），以此类推。

示例 1:

输入: formula = "H2O"

输出: "H2O"

解释: 原子的数量是 {'H': 2, 'O': 1}。

示例 2:

输入: formula = "Mg(OH)2"

输出: "H2MgO2"

解释: 原子的数量是 {'H': 2, 'Mg': 1, 'O': 2}。

示例 3:

输入: formula = "K4(ON(SO3)2)2"

输出: "K4N2O14S4"

解释: 原子的数量是 {'K': 4, 'N': 2, 'O': 14, 'S': 4}。

注意:

所有原子的第一个字母为大写，剩余字母都是小写。
formula 的长度在[1, 1000]之间。
formula 只包含字母、数字和圆括号，并且题目中给定的是合法的化学式。

数据结构 + 模拟

一道综合模拟题。

相比于（题解）227. 基本计算器 II 的表达式计算问题，本题设计模拟流程的难度要低很多，之所谓定位困难估计是使用到的数据结构较多一些。

为了方便，我们约定以下命名：

称一段完整的连续字母为「原子」
称一段完整的连续数字为「数值」
称( 和) 为「符号」

基本实现思路如下：

在处理入参 s 的过程中，始终维护着一个哈希表 map，map 中实时维护着某个「原子」对应的实际「数值」（即存储格式为 {H:2,S:1}）；

由于相同原子可以出在 s 的不同位置中，为了某个「数值」对「原子」的累乘效果被重复应用，我们这里应用一个”小技巧“：为每个「原子」增加一个”编号后缀“。即实际存储时为 {H_1:2, S_2:1, H_3:1}。

根据当前处理到的字符分情况讨论：

符号：直接入栈；
原子：继续往后取，直到取得完整的原子名称，将完整原子名称入栈，同时在map 中计数加；
数值：继续往后取，直到取得完整的数值并解析，然后根据栈顶元素是否为) 符号，决定该数值应用给哪些原子：

如果栈顶元素不为)，说明该数值只能应用给栈顶的原子
如果栈顶元素是 )，说明当前数值可以应用给「连续一段」的原子中

对 map 的原子做 “合并” 操作：{H_1:2, S_2:1, H_3:1} => {H:3, S:1} ；
使用「优先队列（堆）」实现字典序排序（也可以直接使用 List，然后通过 Collections.sort 进行排序），并构造答案。

Java 代码：

class Solution {
class Node {
String s; int v;
Node (String _s, int _v) {
s = _s; v = _v;
}
}
public String countOfAtoms(String s) {
int n = s.length();
char[] cs = s.toCharArray();
Map<String, Integer> map = new HashMap<>();
Deque<String> d = new ArrayDeque<>();
int idx = 0;
for (int i = 0; i < n; ) {
char c = cs[i];
if (c == '(' || c == ')') {
d.addLast(String.valueOf(c));
i++;
} else {
if (Character.isDigit(c)) {
// 获取完整的数字，并解析出对应的数值
int j = i;
while (j < n && Character.isDigit(cs[j])) j++;
String numStr = s.substring(i, j);
i = j;
int cnt = Integer.parseInt(String.valueOf(numStr));

// 如果栈顶元素是 )，说明当前数值可以应用给「连续一段」的原子中
if (!d.isEmpty() && d.peekLast().equals(")")) {
List<String> tmp = new ArrayList<>();

d.pollLast(); // pop )
while (!d.isEmpty() && !d.peekLast().equals("(")) {
String cur = d.pollLast();
map.put(cur, map.getOrDefault(cur, 1) * cnt);
tmp.add(cur);
}
d.pollLast(); // pop (

for (int k = tmp.size() - 1; k >= 0; k--) {
d.addLast(tmp.get(k));
}

// 如果栈顶元素不是 )，说明当前数值只能应用给栈顶的原子
} else {
String cur = d.pollLast();
map.put(cur, map.getOrDefault(cur, 1) * cnt);
d.addLast(cur);
}
} else {
// 获取完整的原子名
int j = i + 1;
while (j < n && Character.isLowerCase(cs[j])) j++;
String cur = s.substring(i, j) + "_" + String.valueOf(idx++);
map.put(cur, map.getOrDefault(cur, 0) + 1);
i = j;
d.addLast(cur);
}
}
}

// 将不同编号的相同原子进行合并
Map<String, Node> mm = new HashMap<>();
for (String key : map.keySet()) {
String atom = key.split("_")[0];
int cnt = map.get(key);
Node node = null;
if (mm.containsKey(atom)) {
node = mm.get(atom);
} else {
node = new Node(atom, 0);
}
node.v += cnt;
mm.put(atom, node);
}

// 使用优先队列（堆）对 Node 进行字典序排序，并构造答案
PriorityQueue<Node> q = new PriorityQueue<Node>((a,b)->a.s.compareTo(b.s));
for (String atom : mm.keySet()) q.add(mm.get(atom));

StringBuilder sb = new StringBuilder();
while (!q.isEmpty()) {
Node poll = q.poll();
sb.append(poll.s);
if (poll.v > 1) sb.append(poll.v);
}

return sb.toString();
}
}

Python 3 代码：

class Solution:
def countOfAtoms(self, formula: str) -> str:
n = len(formula)
map = defaultdict(lambda: 1)
d = deque([])
i = idx = 0
while i < n:
c = formula[i]
if c == '(' or c == ')':
d.append(c)
i += 1
else:
if str.isdigit(c):
# 获取完整的数字，并解析出对应的数值
j = i
while j < n and str.isdigit(formula[j]):
j += 1
cnt = int(formula[i:j])
i = j
# 如果栈顶元素是 )，说明当前数值可以应用给「连续一段」的原子中
if d and d[-1] == ')':
tmp = []
d.pop()
while d and d[-1] != '(':
cur = d.pop()
map[cur] *= cnt
tmp.append(cur)
d.pop()

for k in range(len(tmp) - 1, -1, -1):
d.append(tmp[k])
# 如果栈顶元素不是 )，说明当前数值只能应用给栈顶的原子
else:
cur = d.pop()
map[cur] *= cnt
d.append(cur)
else:
# 获取完整的原子名
j = i + 1
while j < n and str.islower(formula[j]):
j += 1
cur = formula[i:j] + "_" + str(idx)
idx += 1
map[cur] = 1
i = j
d.append(cur)

# 将不同编号的相同原子进行合并
mm = defaultdict(int)
for key, cnt in map.items():
atom = key.split("_")[0]
mm[atom] += cnt

# 对mm中的key进行排序作为答案
ans = []
for key in sorted(mm.keys()):
if mm[key] > 1:
ans.append(key+str(mm[key]))
else:
ans.append(key)
return "".join(ans)

时间复杂度：最坏情况下，每次处理数值都需要从栈中取出元素进行应用，处理s 的复杂度为；最坏情况下，每个原子独立分布，合并的复杂度为；将合并后的内容存入优先队列并取出构造答案的复杂度为；整体复杂度为
空间复杂度：

最后

这是我们「刷穿 LeetCode」系列文章的第 No.726 篇，系列开始于 2021/01/01，截止于起始日 LeetCode 上共有 1916 道题目，部分是有锁题，我们将先把所有不带锁的题目刷完。

在这个系列文章里面，除了讲解解题思路以外，还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码，我建立了相关的仓库：github.com/SharingSour… 。

在仓库地址里，你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

【文章转自香港云服务器 http://www.1234xp.com 复制请保留原URL】

上一篇：【每日算法】详解几种「枚举 & 计数」的基本思路
下一篇：没有了

【每日算法】数据结构运用模拟题（双栈表达式计算的简化版）

题目描述

数据结构 + 模拟

最后

相关文章