Python大数据分析

其他

8个 Python 加速运行优化技巧

编译为机器码执行,大大提高代码运行速度。关于numba的更多信息见下面的主页:http://numba.pydata.org/numba.pydata.org#
2023年8月28日
其他

pandas中基于范围条件进行表连接

添加微信号"CNFeffery"加入技术交流群❝本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills❞这是我的系列文章「Python实用秘技」的第15期,本系列立足于笔者日常工作中使用Python积累的心得体会,每一期为大家带来一个几分钟内就可学会的简单小技巧。作为系列第15期,我们即将学习的是:在pandas中基于范围条件进行表连接。表连接是我们日常开展数据分析过程中很常见的操作,在pandas中基于join()、merge()等方法,可以根据左右表连接依赖字段之间对应值是否相等,来实现常规的表连接。但在有些情况下,我们可能需要基于一些“特殊”的条件匹配,来完成左右表之间的表连接操作,譬如对于下面的示例数据框demo_left和demo_right:假如我们需要基于demo_left的left_id等于demo_right的right_id,且demo_left的datetime与demo_right的datetime之间相差不超过7天,这样的条件来进行表连接,「通常的做法」是先根据left_id和right_id进行连接,再在初步连接的结果表中基于left_id或right_id进行分组筛选运算,过滤掉时间差大于7天的记录:而除了上面的方式以外,我们还可以基于之前的文章中给大家介绍过的pandas的功能拓展库pyjanitor中的「条件连接方法」,直接基于范围比较进行连接,且该方式还支持numba加速运算:更多有关pyjanitor的使用技巧请移步https://pyjanitor-devs.github.io/pyjanitor/阅读更多。本期分享结束,咱们下回见~👋加入知识星球【我们谈论数据科学】500+小伙伴一起学习!·
2023年7月8日
其他

如何快速优化Python导包顺序

添加微信号"CNFeffery"加入技术交流群❝本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills❞这是我的系列文章「Python实用秘技」的第14期,本系列立足于笔者日常工作中使用Python积累的心得体会,每一期为大家带来一个几分钟内就可学会的简单小技巧。作为系列第14期,我们即将学习的是:快速优化Python导包顺序。当我们书写Python代码的时候,遵守标准的代码规范可以帮助我们提升代码的可读性和易维护性。而在常见的Python代码规范中,我们在代码开头导包时,建议按照标准库>第三方库>自定义库或相对引用库的顺序组织代码,且各类型导包逻辑中建议按照字母顺序进行排列。但在日常代码编写过程中,我们很难一直手动保持这样的标准习惯,这时我们就可以使用usort这个实用的工具来辅助优化代码中的导包顺序😉。usort由facebook即现在的meta公司进行开源维护,使用pip
2023年6月15日
其他

Jupyter Notebook为什么适合数据分析?

应用程序,可让我们创建并共享代码和文档。它提供了一个环境,你可以在其中记录代码,运行代码,查看结果,可视化数据并在查看输出结果。这些特性使其成为一款执行端到端数据科学工作流程的便捷工具
2023年5月9日
其他

教你使用Python Statsmodel进行假设检验和线性回归

函数返回数据的综述、平均值、标准差、最小值、最大值和四分位数。2、数据可视化数据可视化是数据分析的重要组成部分。我们可以直接使用matplotlab来进行可视化:
2023年5月8日
其他

n倍加速geopandas运算是什么体验

基础使用dask-geopandas与geopandas的常用计算API是相通的,但调用方式略有不同,举一个实际例子,其中示例文件demo_points.gdb由以下代码随机生成并写出:import
2023年3月18日
其他

我学Python常逛的10个网站

1、Python官方文档最全面的Python学习网站非官方文档莫属,它不仅提供了下载安装教程、基础语法教程、标准库、模块、各类术语解释、API接口等内容,还准时更新Python最新版本的变化信息,以及常见问题答疑。Python官方文档是英文为主,也提供了中文等其他翻译,但建议看英文,最准确最全面。如果你英文不好,很难精进Python编程,可以乘着看文档的契机好好补一下。如果你能耐心的跟着官方文档去学Python,并养成遇到问题去检索文档的习惯,绝对会成长飞快。2、牛客网牛客网是国内比较火的刷题网站,上面拥有众多关于Python的面试真题,也有适合小白初学的训练题。Python练习题不仅包括语法,还有数据分析、机器学习、爬虫、可视化等你可以在牛客网上的编程环境里写代码,无需自己安装Python软件,非常方便,可以试试看。3、GithubGithub是全球最大的代码托管网站,也是Python资源最多的网站。各种Python相关的教程、开源项目、技术书籍、数据资源层出不穷,比如说大名鼎鼎的pandas、django、tensorflow、pytorch、requests等都在github上有开源代码。还有诸如awe-some
2023年3月6日
其他

Python中临时文件的妙用

添加微信号"CNFeffery"加入技术交流群❝本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills❞这是我的系列文章「Python实用秘技」的第13期,本系列立足于笔者日常工作中使用Python积累的心得体会,每一期为大家带来一个几分钟内就可学会的简单小技巧。作为系列第13期,我们即将学习的是:Python中临时文件的妙用。当我们用Python编写程序时,有时候需要临时存储数据且不希望占用多少内存,亦或是需要写出文件到文件系统供后续程序读取,这些情况下以创建临时文件的方式进行处理,既不会干扰本地文件系统,又安全省事。而通过使用Python中的标准库tempfile,我们就可以很方便的进行临时文件相关操作,其主要用法有两种:「创建临时文件」tempfile的经典用法之一是使用其TemporaryFile()配合with上下文管理器,在本地文件系统的临时文件目录下创建具有随机名称的文件,并且在with内的代码执行完成后,该临时文件会自动被销毁:import
2023年2月26日
其他

10个用于可解释AI的Python库

exPlanations)SHAP是一种博弈论方法,可用于解释任何机器学习模型的输出。它使用博弈论中的经典Shapley值及其相关扩展将最佳信用分配与本地解释联系起来。2、LIME(Local
2023年2月20日
其他

用ChatGPT做excel表格真香!只需动嘴提要求和复制粘贴

·dill:Python中增强版的pickle边玩游戏边学Git?这个开源网站我爱了在Python中将markdown转换为漂亮的网页
2023年2月9日
其他

基于matplotlib轻松绘制漂亮的表格

控制表格奇数偶数行底色通过在Table()中设置参数odd_row_color和even_row_color,我们可以传入matplotlib中合法的色彩值进行表格奇数偶数行底色的设置:2.2.2
2023年2月2日
其他

像导入Python模块一样导入ipynb文件

添加微信号"CNFeffery"加入技术交流群❝本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills❞这是我的系列文章「Python实用秘技」的第12期,本系列立足于笔者日常工作中使用Python积累的心得体会,每一期为大家带来一个几分钟内就可学会的简单小技巧。作为系列第12期,我们即将学习的是:像导入模块一样导入ipynb文件。对于从事数据科学行业的朋友来说,大部分时候我们都是在jupyter中进行日常代码的书写,但ipynb文件格式作为特殊的格式,默认是无法像常规的py文件那样作为模块进行各种对象的导入。而通过import-ipynb这个库,我们就可以轻松地将ipynb文件当成py文件一样进行自由导入,使用pip
2023年1月12日
其他

geopandas直接支持gdb文件写出与追加

-y来对gdal进行升级,可以看到随着gdal的升级,fiona中的OpenFileGDB权限更新为'raw',这意味着我们拥有了对gdb文件的读、写、追加操作能力:与我以前为大家介绍过的ESRI
2023年1月4日
自由知乎 自由微博
其他

一图胜千言!详解Python数据可视化

标记),差(用圆标记):用色调表示红酒的类型,由深度和数据点大小确定的酸度表征总二氧化硫含量。这个解释起来可能有点费劲,但是在试图理解多维数据的隐藏信息时,最好结合一些绘图组件将其可视化。结合形状和
2022年11月16日
其他

geopandas中拓扑错误的发现诊断与修复

添加微信号"CNFeffery"加入技术交流群❝本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes❞1
2022年10月30日
其他

总结了90条简单实用的Python编程技巧

解释器内部的定义(2)在解释器中直接输入变量,默认调用repr函数,而print(var)默认调用str函数(3)repr函数的返回值一般可以用eval函数来还原对象(4)两者分别调用对象的内建函数
2022年10月29日
其他

Python中这样操作url也太爽了吧

添加微信号"CNFeffery"加入技术交流群❝本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes❞1
2022年10月22日
其他

一种更优雅书写Python代码的方式

使用filter()进行值过滤我们最开始的例子中使用过它,用法就是基于传入的lambda函数对每个元素进行条件判断,并保留结果为True的,与javascript中的filter()方法非常相似:(
2022年10月15日
其他

dill:Python中增强版的pickle

添加微信号"CNFeffery"加入技术交流群❝本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes❞1
2022年9月17日
其他

边玩游戏边学Git?这个开源网站我爱了

·在Python中将markdown转换为漂亮的网页超实用!深度比较Python对象之间的差异新一代Python包管理工具来了
2022年9月13日
其他

在Python中将markdown转换为漂亮的网页

【玩转dash】公众号后台回复关键词【加群】加入技术交流区大家好我是费老师,就在今天,由费老师我开源维护的Python库feffery-markdown-components(简称fmc)正式发布了其0.1.0版本(官网地址:http://fmc.feffery.tech/
2022年8月20日
其他

iPad适合用来写Python吗?

B站上有很多博主拍过iPad作为生产力的视频,比如用iPad画漫画、记笔记、剪视频、轻办公等等,那么iPad可以用来写代码、跑Python吗?这也是一些初学Python的小伙伴关心的问题,他们经常下载一些编辑Python的APP,试图在上面练习Python,比如像pythonista、Pyto、Python3IDE等。「我的想法是iPad并不适合写代码,更不适合运行Python,因为它既有环境很多限制,也不方便编辑。」如知乎回答调侃说:iPad唯一一个有利于学习python的功能就是关机.....但如果你非要用的话,可以考虑iPad
2022年8月10日
其他

使用VScode的几点感受,对比Pycharm、Jupyter优劣势

之前一直是PyCharm+Jupyter的组合,能满足几乎所有的Python开发需求。最近我开始用vscode,发现很香。PyCharm适合做项目开发,或者平常写写脚本,算是全能型IDE。但PyCharm体积大,对硬件消耗厉害,不够轻便。Jupyter是近年流行起来的开发工具,基于IPython,主要应用于数据分析、机器学习。它实质是一个web应用,让你在浏览器上写python,即写即运行,所以适合做数据探索分析。虽然Jupyter数据开发模式很方便,但它的开发场景毕竟有限,不适合脚本编写和项目开发,debug等功能也处在改善阶段。如果要为PyCharm和Jupyter找一个替代IDE,能覆盖两者大部分功能,那可能非vscode莫属了。vscode是微软主推的轻量级代码编辑器,安装Python插件后可以编译代码。之所以说vscode能替代PyCharm和Jupyter,因为它既可以写Python脚本项目,也可以运行Jupyter
2022年8月9日
其他

如何最简单、通俗地理解Python模块?

说简单点,Python模块就是带.py后缀的可执行文件,用来重复调用变量和函数。比方说,你在数据分析过程中反复需要读取CSV文件,除了使用pandas等现成的库方法外,还可以自己写一个模块用于调用。#
2022年8月7日
其他

超实用!深度比较Python对象之间的差异

添加微信号"CNFeffery"加入技术交流群❝本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills❞这是我的系列文章「Python实用秘技」的第10期,本系列立足于笔者日常工作中使用Python积累的心得体会,每一期为大家带来一个几分钟内就可学会的简单小技巧。作为系列第10期,我们即将学习的是:深度比较Python对象间差异。很多情况下我们需要对两条数据之间的差异进行比较,如果仅仅是针对数值型对象,那么两者的差值就是所谓的差异,但是如果要比较两条JSON数据间的差异呢?由于JSON数据具有可嵌套可分层的特点,想要明确找出两条JSON数据间的差异并加以描述,如果自己书写方法还是有些费事。这种情况我们就可以使用到第三方库deepdiff中的DeepDiff()方法,它基于递归对不同对象进行深度比较。使用pip
2022年8月6日
其他

Python中更好用的函数运算缓存

添加微信号"CNFeffery"加入技术交流群❝本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills❞这是我的系列文章「Python实用秘技」的第9期,本系列立足于笔者日常工作中使用Python积累的心得体会,每一期为大家带来一个几分钟内就可学会的简单小技巧。作为系列第9期,我们即将学习的是:在Python中实现更简单好用的函数运算缓存。函数运算缓存,顾名思义就是我们可以针对指定的函数,让其记住过往参数输入和返回结果,使得后续接收到相同的参数时跳过函数运算,直接返回已缓存的结果值。很多朋友应该知道Python标准库里functools.lru_cache可以做函数运算缓存,但是它的功能实在是太简陋了,像过期时间设置之类的功能都没有。而我们可以使用第三方库cachier来代替,它的基本使用方式非常简单,使用pip
2022年7月24日
其他

为什么要使用markdown进行写作?

知乎上有人问,markdown为什么会流行?我用markdown写技术笔记快5年了,真的很香。markdown是一种文本标记语言,不是软件,所以和word、notepad等编辑器不是一回事,反而和HTML比较像,这其中的关系比较绕,我来理一下。word是富文本编辑器,可以自定义丰富的文本形式,比如图片、格式等,但传播性、一致性差。notepad是纯文本编辑器,只能写简单的文本,没有样式,过于简单,适合纯文本传播。HTML也是标记语言,用纯文本形式来制作富文本,但需要浏览器渲染,适合前端。Markdown则是单纯用于文本写作的标记语言,相当于简化的HTML,适合普通人使用。使用markdown有3点好处:1、标准化。markdown文本标记进行排版,语法是标准化的,不会因为平台软件而改变,所以可以一次编写,到处渲染。你可以在windows、mac、linux、ios、andriod等各种平台上进行编辑和同步,不会出现错乱情况。因此使用markdown进行文档编写其实比word更简单,你只需记住它的语法,在任何平台都可以编辑。2、多元化。markdown不光支持标题、粗体、文本引用等常见的文本格式,还支持图片、超链接、代码、LaTex公式、流程图、图表、字体、颜色等多元化的操作,如果你懂css,还可以进行丰富的前端渲染,让多媒体文本更好看。3、专业化。因为markdown有固定的语法格式,所以更准确、更简洁。很多书籍、论文、文档、博客、网站的文档编写都是基于markdown,相信技术博主都会有此感悟。如果你经常有写作需求,那么可以尝试下markdown,真的用着用着就回不去了。markdown的编辑器有很多,知乎、简书编辑器都支持markdown,在国内比较好用且出名的是Typora,可以试试。加入知识星球【我们谈论数据科学】500+小伙伴一起学习!·
2022年7月23日
其他

Jupyter notebook中5个有趣的魔法命令

notebook中有很多实用且鲜为人知的功能,可以实现有趣的操作,这次举5个简单的例子。1、脚本代码写入本地文件%%file方法可以将脚本代码写入本地Py文件。%%file
2022年7月22日
其他

日常工作中,Python+Pandas是否能代替Excel+VBA?

知乎上有个热门提问,日常工作中Python+Pandas是否能代替Excel+VBA?我的建议是,两者是互补关系,不存在谁替代谁。复杂数据分析挖掘用Python+Pandas,日常简单数据处理用Excel+VBA。从数据处理分析能力来看,Python+Pandas肯定是能取代Excel+VBA的,而且要远远比后者强大。但从便利性、传播性、市场认可度来看,Excel+VBA在职场工作上还是无法取代的。因为Excel符合绝大多数人的使用习惯,使用成本更低。就像Photoshop能修出更专业的照片,为什么大部分人在用美图秀秀?道理是一样的。从市场接受度来看,Python对比Excel有三个差异点。注意我这里说的是差异点,不是劣势,因为不同品种的东西,没办法进行优劣比较。1、Python学习门槛相对较高虽然Python在编程语言里算最容易入门的,但是它仍然是一门编程语言,需要你理解变量、函数、逻辑语句、类、线程进程等编程知识,对于大部分非IT专业的人来说,学习门槛是相当高的。而且学习Python数据分析不光是学习Python语法本身,你还要学习Pandas、Numpy、Matplotlib、SKlearn等各种数据科学库,因为大部分数据处理函数都包装在这些库里。很多库学习的难度不比Python本身容易,因为这些大库的生态很复杂。比如Pandas,它的函数方法起码得有成千上万个,还有不胜其数的参数和逻辑,就像是你在手撸Excel底层代码去做数据分析。所以Python擅长处理复杂度高、重复性高、数据量大的场景Excel呢?几乎大部分懂点电脑的人可以零门槛去使用,或者说简单看些教程,就可以使用函数、透视表进行数据处理,入门学习成本极低。当然,高阶操作和VBA也是需要花时间去研究的。2、Python使用成本相对较高前面说过Python不像Excel这种图形界面软件,拿来即用,不会出现什么幺蛾子。Python用起来相比Excel麻烦点,有可能你跑成功的代码换到同事电脑就会出现bug,因为Python涉及环境配置、依赖关系,且语法格式比较严格,稍有不对就会报错。所以很多Python的学习者会止步在安装配置、bug处理上,还没进行数据分析就放弃了。对于Excel,可能就不会存在这些问题,或者很少。公司里上到董事长、CEO,下到基层员工,几乎都在用Excel。你用Excel做出来的东西,可以毫无沟通障碍的同步给领导同事,哪怕是用到VBA等复杂功能,也可以轻松解释。当然这里不涉及复杂的开发的场景,只是日常办公的数据处理和协作,Excel比Python更实用。如果是跑算法、写自动化工具,肯定Python相对合适。3、Excel在某些应用场景已经通用化,产生路径依赖多数人对Excel产生了路径依赖。Excel面世几十年,在各行各业都有深层次的应用,积累了大量代码、公式、流程、素材等,很难在一朝一夕去找到替代品。Excel是世界上最成功的软件之一,微软每年用养成本上千的工程师去开发维护Excel,把Excel封装成日常办公最方便的数据工具。其实微软考虑的是满足95%的人需求即可,剩下5%的人可以尽情地去用Java、Python等工具。所以不是说功能越强,我们越应该用什么,而且考虑到现有的规则、经验、行情,做出最有解选择。小结综上,大部分人使用Excel,而不是Python进行数据分析,是很正常的事。因为简单而有效的东西往往是最受欢迎的,Python其实也一直在往这个方向努力,相信它的明天会无比美好。加入知识星球【我们谈论数据科学】500+小伙伴一起学习!·
2022年7月13日
其他

不只是快,详解geopandas新版文件读写

基于pyogrio的矢量文件写出相较于文件的读取,新引擎中涉及文件写出的功能参数就寡淡很多,只发现一个比较特别的promote_to_multi参数,用于强制将单部件要素转换为多部件要素:2.3
2022年7月8日
其他

D-Tale,实现Pandas GUI高效数据探索分析

Github地址:https://github.com/man-group/dtale加入知识星球【我们谈论数据科学】500+小伙伴一起学习!·
2022年7月7日
其他

纯Python开发在线GeoJSON数据生成器

【玩转dash】公众号后台回复关键词【geojson】获取本期全部源码在今天的教程中,费老师我将为大家展示如何通过纯Python编程的方式,开发出一个在线地图应用,使得我们可以在在线地图上交互式地绘制一个个的地理围栏,并为其逐一添加相关属性字段,最后一键导出为常用的GeoJSON格式文件,非常地简单快捷,下面的视频展示了这个应用的使用方式:而我是如何只用Python就开发出这样功能丰富的网页应用的呢,下面我就来给大家详细介绍:1
2022年7月3日
其他

1行代码生成随机迷宫,这个概率编程语言登GitHub热榜

来源:量子位探索游戏中的迷宫很有趣,然而玩多了就没啥“新鲜感”了?没错,如果游戏迷宫差别不大,时间一久就容易熟悉地图,降低了探索的乐趣。现在,一个“横空出现”的概率编程语言MarkovJunior解决了这一问题:利用马尔科夫算法,随机生成批量迷宫,没有一个是重复的,你永远也不知道玩到的下一个迷宫长什么样子:不仅是2D迷宫,就连需要搭建好几层地图的3D迷宫,也能随机生成:这个项目一出,立刻上了GitHub热榜,不到一周就已经收获2.6k
2022年6月28日
其他

geopandas 0.11版本重要新特性一览

添加微信号"CNFeffery"加入技术交流群❝本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes❞1
2022年6月25日
其他

一行代码加速sklearn运算上千倍

添加微信号"CNFeffery"加入技术交流群❝本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes❞1
2022年6月18日
其他

Python-master,实用Python脚本合集!

Python这门语言很适合用来写些实用的小脚本,跑个自动化、爬虫、算法什么的,非常方便。这也是很多人学习Python的乐趣所在,可能只需要花个礼拜入门语法,就能用第三方库去解决实际问题。我在Github上就看到过不少Python代码的项目,几十行代码就能实现一个场景功能,非常实用。比方说仓库Python-master里就有很多不错的实用Python脚本,举几个简单例子:1、创建二维码import
2022年6月11日
其他

Python处理办公自动化的10大场景

print(table1)3、Python处理Email在Python中可以使用smtplib配合email库,来实现邮件的自动化传输,非常方便。import
2022年6月6日
其他

Python中最值得学习的第三方JSON库

添加微信号"CNFeffery"加入技术交流群❝本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes❞1
2022年6月5日
其他

这个网站有195万个Python Q&A

yield关键字有个热门问题:该回答共1.2万点赞,48个回答,top1的回答有1.7万点赞,回答的很经典非常值得看。我觉得问答网站不光要有好的回答者,同时更应该有好的提问者,Stack
2022年5月30日
其他

提升Github使用体验的8个技巧

在markdown中绘制在线地图github支持使用markdown编写的文档或内容中利用特殊的语法插入geoJSON或topoJSON数据,从而直接渲染交互式在线地图:geoJSON示例-
2022年5月29日
其他

8张PPT带你了解Pyecharts地图可视化

前几天,一位公众号粉丝问我,Python在GIS领域越来越火,到底有哪些开源库值得学习?之所以很多GIS行业的人学习Python,是因为Python在GIS数据处理和可视化领域有很多开源工具,还能友好的支持PostgreSQL。我给他列了几个方向,如果是GIS数据处理,肯定要学习Shapely、GDAL、ArcPy、GeoPandas、Numpy;如果是GIS数据库,非Sycopg2莫属;如果是地图可视化,可以学习Matplotlib、Cartopy、Folium、PyEcharts等。说到PyEcharts,我刚好前段时间做了几页课件PPT,于是给他看了,这里也分享给大家。PyEcharts是Echarts的Python接口,而Echarts是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。同时Echarts在地图可视化领域也有很多强大的功能,值得一学。小编已经打包好ppt,大家在公众号后台回复【a】,即可获得PDF版。加入知识星球【我们谈论数据科学】500+小伙伴一起学习!·
2022年5月28日
其他

Python的哪个Web框架学习周期短,学习成本低?

知乎上有人问,Python的哪个Web框架学习周期短,学习成本低?很多人推荐Flask,老牌轻量级web框架,确实是初学者的首选。这几天我在Github上看到FastApi,觉得比Flask更轻量。FastApi是这两年异军突起的网红web框架,适合新手快速入门。。总的来说,FastAPI有三个优点:快、简、强。它的自我标签就是:FastAPI
2022年5月24日
其他

R 和 Python用于统计学分析,哪个更好?

·盘点2021最佳数据可视化作品一行代码实现地址信息解析新一代Python包管理工具来了
2022年5月21日
其他

有人问,如何找到适合的Python库?

Python生态有成千上万个第三方库,如何找到满足自己需求的库呢?找合适的Python库其实很简单,按照以下三步法,你能找到90%的Python库。1、百度谷歌搜索明确自己的需求,用Python来干什么,力求简短明了。比如定位“数据分析”,然后去搜索关键词【Python+数据分析+第三方库】,会出现很多博客推荐的关于数据分析的第三方库.这也是大部分人找Python库的方法,也是最简单的方法。搜出来别人的经验贴,看看是否适合自己。但这种方法有时候很难精准搜索,而且很多冷门库没什么内容,搜索引擎自然无法抓取到你想要的库。如果通过搜索你找不到自己想要的库,那只好用第二种方法。2、在PyPi中搜索PyPi是Pyton的包索引平台,全称Python
2022年5月19日
其他

纯Python开发在线二维码生成工具

【玩转dash】公众号后台回复关键词【二维码】获取本期全部源码在今天的教程中,费老师我将为大家展示如何通过纯Python编程的方式,开发出一个网页应用,从而帮助用户直接通过浏览器访问,即可基于输入的网址等文字内容,完成常规二维码、静态底图二维码以及动图底图二维码的快捷生成,先来看一看应用的主要功能操作演示:只写Python开发这样精致的工具应用非常简单,下面我来带大家从搭建环境开始,学习整个过程:1
2022年5月16日
其他

Matplotlib绘图9种经典风格,你喜欢哪种?

学过Python的小伙伴都会知道,Matplotlib是Python生态最好用的可视化工具库,吹爆也不为过。👍Matplotlib作为高度定制化的绘图工具,它能让使用者很轻松地将数据图形化,并且提供多样化的输出格式。只要你使用Python编程便可完美绘制二维统计图表、三维图表、动态图表、交互图表,甚至可以编辑图片,修改各种元素。📊刚接触Matplotlib的小伙伴可能无法绘制出好看的图,这里建议使用内置的style风格,只需要一行代码便可以让图表变得好看。🤩Matplotlib提供了几十种图表样式,满足了不同场景和需求,比如论文用图、会议用图、报告用图等。我这里选了9种比较喜欢的分享出来,希望能帮助到需要的小伙伴。style使用方式:👇👇👇
2022年5月15日
其他

Python中最简单易用的并行加速技巧

添加微信号"CNFeffery"加入技术交流群❝本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes❞1
2022年5月14日
其他

​Python实现常见的8个概率分布公式和可视化

discrete_uniform_pmf)ax[0].set_xlabel("X")ax[0].set_ylabel("Probability")ax[0].set_title("Discrete
2022年5月9日
其他

一行代码实现地址信息解析

添加微信号"CNFeffery"加入技术交流群❝本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills❞这是我的系列文章「「Python实用秘技」」的第8期,本系列立足于笔者日常工作中使用Python积累的心得体会,每一期为大家带来一个几分钟内就可学会的简单小技巧。作为系列第8期,我们即将学习的是:一行代码解析地址信息。在日常数据处理的过程中,有时候拿到手的是完整的地址信息,如果需要从地址信息中解析出相应的各级行政单元名称,方式有很多,而今天要介绍的方式只需要一行代码即可快速实现。首先我们需要安装jionlp这个非常好用的文本预处理工具包,建议使用国内镜像安装:pip
2022年5月5日
其他

新手如何入门学习PostgreSQL?

在各种数据岗招聘中,SQL几乎成为了必备技能。有公司的地方就会有数据,有数据的地方就会有数据库,有数据库的地方就会有SQL。SQL在数据分析中到底有多重要?这么说吧,除了Excel外,SQL是数据工作最常接触的到的工具。虽然本质上SQL和Excel都用来处理分析数据,但不一样的是,SQL是一种查询语言,并非可视化的软件,所以学习门槛更高,需要使用者有多的逻辑思考。当然学习SQL并非难事,对比Java、C++、Python这类编程语言,SQL的语言逻辑更为简单,你可以从SQL的3个功能来初步了解它。(1)
2022年5月3日