题目描述
请你来实现一个 atoi
函数,使其能将字符串转换成整数。首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
- 如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
- 假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
- 该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意: 假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。在任何情况下,若函数不能进行有效的转换时,请返回 0
。
示例 1:
输入:
"42"
输出:42
示例 2:
输入:
" -42"
输出:-42
解释: 第一个非空白字符为'-'
, 它是一个负号。我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到-42
。
示例 3:
输入:
"4193 with words"
输出:4193
解释: 转换截止于数字'3'
,因为它的下一个字符不为数字。
示例 4:
输入:
"words and 987"
输出:0
解释: 第一个非空字符是'w'
, 但它不是数字或正、负号。因此无法执行有效的转换。
示例 5:
输入:
"-91283472332"
输出:-2147483648
解释: 数字"-91283472332"
超过32
位有符号整数范围。因此返回INT_MIN (−2³¹)
。
提示:
- 本题中的空白字符只包括空格字符
' '
。 - 假设我们的环境只能存储
32
位大小的有符号整数,那么其数值范围为[−2³¹, 2³¹ − 1]
。如果数值超过这个范围,请返回INT_MAX (2³¹ − 1)
或INT_MIN (−2³¹)
。
正常遍历
核心思路
正常遍历字符串,首先去掉空格,然后用 flag
记录正负,接下来遍历字符串中的数字,不断的转换为整数,直到遍历到无用字符为止。考虑到溢出的情况。我们在计算 result
的时候,先判断计算后的值是否对 int
溢出了,使用表达式 (Integer.MAX_VALUE - (c - '0')) * 1.0 / 10 >= result
判断即可。
代码实现
1 | public int myAtoi(String str) { |
复杂度分析
- 时间复杂度:
O(n)
,其中n
为字符串的长度。我们只需要依次处理所有的字符,处理每个字符需要的时间为O(1)
。 - 空间复杂度:
Ο(1)
。只使用了常数级别的额外空间来存储变量。
有限状态机
针对有限状态机的学习还需要深入,先参考下官方的解答:字符串转换整数 | 题解
核心思路
2020-09-04 更新
时隔这么久,终于静下心来研究了下有限状态机的解法。有限状态机在遇到类似“判断一个字符串,是否满足某种规则”这种问题的时候,可以非常有条理的去解决。有限状态机的主要思想是,在程序运行的时候有一个状态 state
,我们从当前输入中取出一个字符,根据当前字符的类型,转移到下一个状态。我们还需要定义一个初始状态和结束状态,这样我们只要建立一个覆盖所有状态的表格,就可以解决本题的问题。先看下官方题解的状态机:

我们建立的表格如下(为了配合下面自己的代码,我把上面的状态做了微小修改):
状态\字符类型 | space | +/- | number | other |
---|---|---|---|---|
space | space | sign | number | end |
sign | end | end | number | end |
number | end | end | number | end |
end | end | end | end | end |
接下来我们写代码只要构造这个 stateTable
,然后遍历字符串并不断更新状态即可。对于本题,我们要在遇到数字的时候进行计算,遇到符号的时候记录正负。
代码实现
1 |
|
复杂度分析
- 时间复杂度:
O(n)
,其中n
为字符串的长度。我们只需要依次处理所有的字符,处理每个字符需要的时间为O(1)
。 - 空间复杂度:
Ο(1)
,自动机的状态只需要常数空间存储。
正常遍历 V2
时隔多年自己又重新做了一遍,有了不同的思考和见解。
核心思路
2025-09-16 更新
我们可以按照题目描述的步骤,逐步处理字符串:
- 处理空字符串:如果输入字符串为空或
null
,直接返回0
。 - 跳过前导空格:使用循环跳过所有前导空格字符。
- 处理正负号:检查当前字符是否为
'+'
或'-'
,并设置相应的符号标志。 - 转换数字:遍历后续字符,如果是数字,则转换为整数。在转换过程中,需要检查是否超出整数范围。如果遇到非数字字符,立即停止转换。
- 处理溢出:在每次转换新数字时,检查当前数值是否超出32位有符号整数范围。如果溢出,则返回对应的整数最大值或最小值。
代码实现
1 | public int myAtoi(String s) { |
复杂度分析
- 时间复杂度:
O(n)
,其中n
为字符串的长度。我们只需要依次处理所有的字符,处理每个字符需要的时间为O(1)
。 - 空间复杂度:
Ο(1)
,只使用了常数级别的额外空间来存储变量。
总结
本题主要考察对字符串的处理和整数溢出的判断。通过逐步处理字符串的前导空格、正负号和数字字符,并在转换过程中及时检查溢出情况,可以高效地实现字符串到整数的转换。代码中需要注意边界条件的处理,例如全空格字符串、正负号后的非数字字符等。
附录
关于32位整数边界
在 Java
中,int
类型是 32
位有符号整数,使用二进制补码表示法。让我们分析 Integer.MIN_VALUE
和 Integer.MAX_VALUE
的二进制表示。
Integer.MAX_VALUE
十进制表示:2³¹ - 1 = 2147483647
二进制表示:0111 1111 1111 1111 1111 1111 1111 1111
十六进制表示:0x7FFFFFFF
特点:
- 最高位(符号位)为
0
,表示正数 - 其余
31
位全部为1
- 这是
32
位有符号整数能表示的最大正数
Integer.MIN_VALUE
十进制表示:-2³¹ = -2147483648
二进制表示:1000 0000 0000 0000 0000 0000 0000 0000
十六进制表示:0x80000000
特点:
- 最高位(符号位)为
1
,表示负数 - 其余
31
位全部为0
- 这是
32
位有符号整数能表示的最小负数 - 在二进制补码表示法中,这个值没有对应的正数(它的绝对值比
Integer.MAX_VALUE
大1
)
二进制补码表示法要点
- 最高位是符号位:
0
表示正数,1
表示负数 - 正数的补码:与其原码相同
- 负数的补码:将其对应正数的二进制表示取反后加
1
- 特殊值:
0
的表示:0000 0000 0000 0000 0000 0000 0000 0000
-1
的表示:1111 1111 1111 1111 1111 1111 1111 1111
重要注意事项
Integer.MIN_VALUE
的绝对值比Integer.MAX_VALUE
大1
,这是二进制补码表示法的特性- 当处理边界值时需要特别小心,例如在字符串转换或数学运算中
- 在
Java
中,Math.abs(Integer.MIN_VALUE)
仍然返回Integer.MIN_VALUE
,因为它的绝对值超出了int
的正数表示范围