查看原文
其他

Python教学 | 有备无患!详解 Python 异常处理(try-except)

企研数据 数据Seminar 2024-03-17



Python教学专栏,旨在为初学者提供系统、全面的Python编程学习体验。通过逐步讲解Python基础语言和编程逻辑,结合实操案例,让小白也能轻松搞懂Python!
>>>点击此处查看往期Python教学内容

本文目录

引言

一、关于异常

二、try-except 用法

三、哪些情况下需要使用 try-except ?

  1. 使用易报错函数时

  2. 使用网络请求数据时
  3. 分批处理大数据集时
  4. ……

四、异常处理注意事项

总结

相关推荐


本文共5707个字,阅读大约需要15分钟,欢迎指正!

引言

无论是数据清洗、转换还是分析,我们都需要确保程序能够稳定地运行,避免数据处理过程中的意外中断。使用 Python 处理大数据集或执行循环程序时,程序异常可能会给我们带来一系列的麻烦,而 Python 解释器一旦遇到异常,就会立即中断程序,其中的原因包括但不限于文件不存在、网络连接中断、数据格式错误、数据内部问题等。
如果我们不希望个别小问题影响整个程序的正常运行,那么就可以使用 Python 的异常处理语句:try-except 。它能够帮助我们略过程序的异常部分或者针对不同类型的异常采取不同的应对措施,保障程序不被未知异常中断。

一、关于异常

异常是我们常说的“报错”,宏观上分为两类,一类是语法错误(SyntaxError),另一类是程序异常(Exception)。无论是语法错误还是程序异常,只要触发,程序就会立刻停止运行。
针对程序异常来说,又分为多种异常,数据处理中常见的异常有以下几种:
  1. KeyError(键错误):当试图访问字典中不存在的键时引发的异常。
  2. ValueError(值错误):当传递给函数的参数类型正确但值不合法时引发的异常。
  3. TypeError(类型错误):当使用不兼容的类型进行操作或函数调用时引发的异常。
  4. FileNotFoundError(文件未找到错误):当试图打开不存在的文件时引发的异常。
  5. IndexError(索引错误):当使用无效的索引访问序列(如列表、元组或字符串)时引发的异常。
  6. OverflowError(溢出错误):当数值运算结果超出了所能表示的范围时引发的异常。
  7. AttributeError(属性错误):当试图访问对象不存在的属性时引发的异常。
  8. UnicodeError(Unicode 错误):当处理字符串时遇到 Unicode 编码相关的错误时引发的异常。
  9. IOError(输入输出错误):当发生与输入输出相关的错误时引发的异常,如读取或写入文件失败。

*图为广告,与正文内容无关
二、try-except 用法
try-except是一个组合语句,书写格式类似于if-else语句,但又有很大的不同。if关键字可以单独出现,代表单分支结构,但tryexcept必须一起使用,缺一不可。try-except的基本结构如下:
try:
    <代码块1>
except:
    <代码块2>
上述结构中,<代码块1>中一般是一些容易“报错”的代码,如果<代码块1>中的代码能够正常运行,那么程序就会逃过<代码块2>去执行后续的其他代码;而<代码块2>中的代码一般是<代码块1>错时的应对措施。总的来说,如果<代码块1>能正常运行,那么皆大欢喜;但如果<代码块1>中的代码出现异常,那么程序就会执行<代码块2>中的代码,而不是直接报错和终止程序。(如果<代码块2>中的代码是 pass,则代表忽略这个异常。)
以上是try-except语句的基本结构,也是最常用的结构,简单粗暴易懂。但当程序变得复杂时,可能就需要更加精准地针对不同类型的异常实施不同的解决方案,这种更复杂的异常处理结构如下:
try:
    <代码块1>
except 异常类型1:
    <代码块2>
except 异常类型2:
    <代码块3>
except 异常类型3:
    <代码块4>
    ……
except Exception:
    <代码块N>
这种结构可以对指定的异常类型分配不同的处理方式,当<代码块1>中出现异常类型1时,程序就会执行<代码块2>,当<代码块1>中出现异常类型2时,程序就会执行<代码块3>……如果抛出的异常类型不属于任何一种已写明的异常,那么都会被归入异常类基类 Exception 中,进而执行<代码块N>
除此之外,try-except还有一些其他结果,包括try-except-elsetry-except-else-finally。这些结果能够实现更多异常处理功能,让代码结构更加清晰,但笔者认为上述两种结果已经足够帮助我们解决 99% 的实际问题了,所以本文就不再对这两种结构多做介绍。

三、哪些情况下需要使用 try-except ?

1. 使用易报错函数时

在使用 OCR 技术识别表格时,得到的表格中,每个单元格中的值都是字符串,因我们需要将存放数值的单元格内容转为数字类型,这就要用到 Python 内置函数 eval()。但是 OCR 识别结果可能会出现少许错误,例如原始数据中的数字 “3.15” 被识别为 “3·15”,那么这个数字就无法被 eval() 函数转为数字,进而抛出异常(eval 函数遇到无法转换的字符时会直接报错而不是返回其他值)。如果我们在转换类型时不希望个别异常数据打断程序的正常运行,那么我们就可以编写一个函数来进行转换,这个函数的功能是,如果输入的字符串可以被转为数字,那么就返回转化结果,如果不可以被转换,那么就输出提示性文字并返回特殊标记,后续再人工核查。
def try_eval(Str):
    try:
        # 尝试直接返回转换后的值
        return eval(Str)
    except:
        # 若无法正常转换,输出提示文字并返回特殊标记
        print(f'输入值【{Str}】无法被正常转换')
        return '--'
因此在应用转换函数时使用优化后的函数,就可以避免程序频繁报错。

*图为广告,与正文内容无关

2. 使用网络请求数据时

很多时候我们需要使用 Python 从网站或服务器中获取数据,例如在采集数据或调用网络服务 API 时。笔者在使用高德地图或者百度地图的地理服务 API 时,请求数据的函数中一般都会使用多层try-except 来规避程序报错。
def revfunc(df):
    lng = df['LNG1']
    lat = df['LAT1']
    if lng != '':
        # 若 经纬度 不为空
        GD_inv = GD.regeocode_by_lonlat(lng, lat)
        try:
            # 若返回状态正常
            if GD_inv['status'] == '1'
                try:
                    # 根据经纬度返回省份、地市、区县、行政区划代码
                    return GD_inv['regeocode']['addressComponent']['province'],\
                           GD_inv['regeocode']['addressComponent']['city'],\
                           GD_inv['regeocode']['addressComponent']['district'],\
                           GD_inv['regeocode']['addressComponent']['adcode']
                except:
                    return '','','',''
            else:
                return '','','',''
        except:
            return '','','',''
    else:
        # 若 经纬度 为空
        return '','','',''
因为这些程序在运行时不仅需要稳定的网络环境,还对输入值有着较为严格的要求,所以出现异常的几率非常之高。因此我们可以使用异常处理结构增加程序稳定性。

3. 分批处理大数据集时

使用 Python 大数据集时,由于计算机(运行)内存空间不足以装载整个数据集,往往需要分批处理,将数据集分成 N 个数据块,每次处理一块数据。如果数据集非常大,同时处理步骤也比较复杂,那么整个程序可能要持续运行数个小时,这就对程序的稳定性有着非常高的要求。如果某个数据块中出现异常数据导致程序中断,我们可能不会立即察觉,后续要重新启动程序,费时费力。在这种情况下,也建议大家使用异常处理结构,防止异常造成程序中断。当然,在此情况下我们还需要做好异常应对策略,不能完全忽略异常的发生,因为这很可能让我们丢失数据。

4. ……

如果您觉得数据处理时还有某些场景比较依赖try-except,欢迎在留言区留言分享。

四、异常处理注意事项

在使用try-except语句时,不能在所有情况下都使用忽略异常这个思路。尤其是在分批处理大数据集时,如果一个数据块在被处理时发生异常,尽管其有着异常处理的代码,但最终这个数据块可能还是没有被成功处理。所以我们一定要在except语句下编写合适的应对代码,例如遇到无法处理的数据块时,先将其单独保存下来,待大部分数据处理完成后,再对这些问题数据进行单独操作。
不仅如此,有些时候我们还需要记录详细的报错信息,并使用日志库将其记录下来,事后分析异常原因,防止后续再次踩坑。

总结


💡Python的异常处理语句try-except提供了一种有效的方式来处理代码中可能出现的异常情况。通过正确地使用try-except,我们可以提高代码的健壮性和可靠性,避免程序崩溃,并且更好地掌控程序流程。同时,我们也应该注意异常处理的细节和注意事项,以保证我们的代码在出现异常时能够正确地响应和处理。
如果你想学习各种 Python 编程技巧,提升个人竞争力,那就加入我们的数据 Seminar 交流群吧,欢迎大家在社群内交流、探索、学习,一起进步!同时您也可以分享通过数据 Seminar 学到的技能以及得到的成果。

扫码联系客服

加入数据seminar-Python交流学习群

相关推荐

Python 教学


 (向下滑动查看更多)

Python实战

 (向下滑动查看更多)

数据可视化

 (向下滑动查看更多)



星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧


往期推荐


数据可视化 | Python数据可视化,无法绕过的matplotlib基础知识!

《管理世界》||  张征宇  等:双重差分设计下固定效应估计量何时可信?——若干有用的建议

机器学习 | 吴恩达:机器学习的六个核心算法

加入我们 | 中国公共政策与绿色发展数据库 (CPPGD) 研究助理 (实习) 招聘公告

全国硕士研究生招生考试初试成绩查询时间




数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


    欢迎扫描👇二维码添加关注    


点击下方“阅读全文”了解更多
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存