-
[摘要]近年来,随着信息技术的迅猛发展,人工智能、大数据、Python等广泛应用于各行各业,传统的财务工作将逐渐被智能会计等所替代,并陆续渗透到财务管理的各个领域。本文首先指出传统财务分析方法已不能适应数据为王的时代需求;其次指出Python语言是目前最接近人类自然语言的计算机编程语言,该技术的问世恰好能够解决传统财务分析存在的问题;最后重点介绍Python在财务数据采集、数据清洗、数据可视化与财务数据分析方面的应用。
[关键词]Python;大数据;数据采集;财务分析
1前言
信息技术高速发展,预计2025年全球数据量将达到175ZB。ZB是多大的单位?据说1ZB电影的时长等同一天24小时不停播放356万年。这说明当今时代背景下,数据增长的爆炸性决定了对数据进行保存、传输以及处理是非常大的工程问题。因此,如果单纯利用传统的数据采集、分析方法,效率将是非常低下的。
2 Python大数据简介
Python语言是目前最接近人类自然语言的计算机编程语言。Python语言解释器的全部代码都是开源的,可以在Python语言的主网站上(https://Python.org/)自由下载,而且在众多大数据处理技术方面,它具有很多优势。
2.1语言简洁,容易入门
Python语言的代码行数比其他语言的少1/10~1/5,但这不影响它们实现相同的功能程序。这种简洁的代码行数可以减少程序错误和开发周期。
2.2多语言集成,生态丰富
在使用Python编程时,还可以将C语言等其他编程语言封装后以Python语言方式使用,这就集成了多种语言,既可以扩大Python计算生态规模,还能提高Python执行程序的速度。
2.3使用方便[1]
Python是一种不同部门的业务人员经过简单的培训就可以进行数据分析工作的非常流行的语言。所以对于非计算机专业出身的大数据与会计专业学生、财务人员来说,可以借助该语言来提高工作学习效率。
3 Python数据采集、数据清洗、数据可视化和数据分析在财务分析中的应用
财务分析通常对企业的盈利能力、偿债能力、营运能力、发展能力以及横向比较等进行分析,本文将通过Python来计算几种能力的指标,并对指标的计算结果进行财务分析。
3.1 Python数据采集
一个完整的数据分析流程大致分为三步:数据采集、数据处理和数据可视化。在实际工作中,数据采集和数据处理所占据的时间远远超过数据可视化。同时,财务指标的计算和分析需要财务数据。因此,财务数据的采集是财务分析的基础,是非常重要的环节。
本环节可以使用数据接口来采集上市公司的数据。首要的是必须了解数据接口规则。接口提供方证券宝的官方网站为http://baostock.com/。证券宝是一个免费开放的证券数据平台,它能提供大量准确完整的证券历史行情数据、上市公司财务数据等。通过Python ApI获取证券数据信息,满足量化交易投资者、数据金融爱好者等数据需求。
假设需要季频盈利能力指标,可通过API接口获取,通过设置参数获取对应年份、季度数据,提供近三年数据,返回的类型为pandas的DataFrame类型。
3.2 Python数据清洗
大多数情况下,我们所接触到的大量数据可能存在缺失、重复、异常,这会导致数据无法直接进行分析。如果将直接获取的数据拿来分析,那将会影响数据的准确性,因此,我们需要对数据进行清洗加工。
3.2.1缺失值的处理
首先,我们需要读取一个存在缺失值的数据表。操作如下:
代码运行如表1。
其次,根据需求删除或填充缺失值。删除缺失值会用到dropna,该词中的na指的是缺失值,这个是Python中的固定写法。若写成dropna(),则表示删除含有缺失值的行。填充缺失值会用到fillna,如果写成fillna(0),则表示用0来填充缺失值,括号内的数值就表示填充的值。
3.2.2重复值的处理
首先,需要读取一个存在重复值的数据。其次,删除数据表中的重复行。这个操作需要用到drop_ duplicates。drop_duplicates()表示删除重复行,也表示默认保留重复的第一条数据。如果需要删除所有行数据,则在括号中标注keep=Flash。如果需要删除指定列的重复值,则需要在括号中填充列名。
3.2.3异常值的处理
异常值的处理用描述性统计查看。其中读取数据操作如下:
3.3 Python数据可视化
俗话说,文不如表,表不如图,在进行财务数据分析时,大段的文字说明或者表格陈列效果不如柱状图、折线图等直观。采用柱状图等可以大大提升表达效果,很直观地让数据使用者捕捉到所需要的信息。Python数据可视化会运用到Matplotlib、Seaborn和Pyecharts三大库[1]。
3.4 Python财务分析
随着信息技术的高速发展,各大企业对财会人员的要求越来越高,传统的方法已经无法适应财务分析中海量的指标计算,企业更多地注重财会人员的财务数据分析能力和计算机编程能力,而Python财务分析正好能够实现二者的结合。本文将采用Python对中国电信从盈利能力、偿债能力、营运能力、发展能力以及横向比较进行分析。
3.4.1盈利能力分析
盈利能力分析是分析公司赚取利润的能力,具体有总资产周转率、净资产收益率、每股收益、销售净利率等。本文以销售毛利率为例描述Python在盈利能力分析中的应用。
在Python中销售毛利率的计算需要用到insert,insert()函数用于向Python列表中指定位置添加一个元素,比如insert(2,‘销售毛利率’,[‘营业收入’]-[‘营业成本’]/[‘营业收入’]),2表示要插入列表中的第2列,销售毛利率表示要插入的元素是销售毛利率,[‘营业收入’]-[‘营业成本’]/[‘营业收入’]表示销售毛利率的计算公式。代码编写如下:
代码运行结果如表2所示。
从表2的数据可以看出,在营业总收入逐年上升的情况下,2022年、2021年销售毛利率较上年同比分别下降2.67%、3.28%。究其原因有以下几个方面。
(1)2022年和2021年的营业成本分别较上年同期增长10.6%和12.9%,主要原因是公司紧抓数字经济发展机遇,加大科技创新及产业数字化等关键领域的投入。同时,持续提升网络质量和能力,支撑5G、政企和新兴业务快速发展。
(2)销售费用增加。2022年和2021年分别较上年同期增长3.1%和6.7%,主要原因是公司在5G发展机遇期投入了必要的营销资源。
(3)管理费用增加。2022年和2021年分别较上年同期增长3.8%和19.2%,主要原因是公司积极推进提质增效,强化费用管控以及公司股票增值权等费用增加所致。
(4)研发费用增幅较大。主要原因是公司强化科技创新,加大高科技人才引进,加强云网融合、5G等核心技术研发[2]。
3.4.2偿债能力分析
偿债能力是衡量企业财务风险、反映企业还本付息的能力。可分为长期偿债能力和短期偿债能力,长期偿债能力指标有资产负债率、权益乘数、利息保障倍数等,短期偿债能力指标有流动比率、速动比率等。本文就Python在流动比率指标的计算中的应用进行分析。
假设在中国电信财务数据表中第3列后面新增一列“流动比率”,“ZGDX[‘流动资产合计’]/[‘流动负债合计’]”就是流动比率的计算公式。所以,根据公式需要抽取流动资产合计和流动负债合计来计算。代码编写如下:
代码运行如表3所示。
从表3的数据可以看出,近三年中国电信的流动比率较低。事实上,身处重资产行业,流动资产当中的支出用于了非流动资产,这个时候流动负债不变,流动资产下降,这就导致流动比率较低。
3.4.3营运能力分析
营运能力是衡量企业运用各项资产赚取收益的能力,该能力方面的指标有应收账款周转率、存货周转率、流动资产周转率等,一般周转次数越高,资产周转效率越高,周转天数也就越短。本文就Python在应收账款周转率指标的计算中的应用进行分析。
假设在中国电信数据表中第2行后面新增一列应收账款周转率,该比率的计算公式是“ZGDX[‘营业总收入’]/((ZGDX[‘应收账款’]+ZGDX[‘应收账款’].shift())/2)”。公式中,“(ZGDX[‘应收账款’]+ZGDX[‘应收账款’].shift())/2”是指平均应收账款,也就是(年初应收账款+年末应收账款)/2。其中ZGDX[‘应收账款’].shift()表示应收账款这一列下移一期,也就是年初应收账款。代码编写如下:
代码运行如表4所示。
从表4的数据可以看出,中国电信的应收账款金额较大,主要是由通信行业特点、公司业务及客户特点导致的。但其应收账款周转率还是比较良好,这个指标越高,说明企业收账速度越快,坏账损失少,偿债能力强;反之,说明营运资金过多呆滞在应收账款上,影响资金周转及偿债能力。
3.4.4发展能力分析
发展能力是反映企业成长性的能力,反映该能力的指标有销售增长率、营业利润增长率、净资产增长率等。本文就Python在销售增长率指标的计算中的应用进行分析。
假设在中国电信财务数据表中第3列后面新增一列销售收入增长率,该比率的公式是“(ZGDX[‘营业总收入’]-ZGDX[‘营业总收入’].shift())/ZGDX[‘营业总收入’].shift()”。同理,公式中“ZGDX[‘营业总收入’].shift()”是营业总收入下移一期,表示年初营业总收入。代码编写如下[3]:
代码运行如表5所示。
从表5的数据可以看出,中国电信业绩亮眼,营业收入逐年增长,这归功于传统业务稳健,创新业务动力十足,公司成长能力优秀。
3.4.5横向比较分析
横向比较是指与竞争对手比较、与行业标杆比较、与行业平均比较等。本文以中国电信为例,将中国电信的盈利能力与行业平均进行比较,以及与同行业的中国移动、中国联通进行比较。中国电信属于通信服务行业,因此需要选取该行业并对该行业的盈利能力指标进行计算,然后再将中国电信的盈利能力指标中的净资产收益率与行业平均进行比较[4]。
首先,计算行业内各上市公司的净资产收益率。代码编写如下:
代码运行如表6所示。
其次,计算2022年净资产收益率行业均值。代码编写如下:
代码运行结果:5.58%。
再次,合并净资产收益率,如表7所示。
最后,采用Seaborn绘制柱状图代码如下:
代码运行如图1所示。
从图1可以了解到中国电信在行业中排名较靠前,总体财务表现优秀。
4结束语
随着大数据时代到来,大数据对于企业来说具有重要价值,企业要想从大量的数据中开展数据发掘以及分析工作,利用Python技术可以获得更有价值的信息,从而达到精确的财务目的。Python在财务分析中的应用,最关键的工作就是数据采集、清洗。借助Python分析财务数据是一种较为高效率的方法,保证企业的财务数据分析工作的顺利进行,帮助企业做出科学准确的发展决策,增强企业竞争力[5]。
主要参考文献
[1]龙月娥.Python财务数据分析及应用[M].北京:高等教育出版社,2022.
[2]刘灿邦.中国电信一季度实现净利润近80亿元推动第二增长曲线快速前行[N].证券时报,2023-04-21(A07).
[3]中国电信.中国电信股份有限公司2022年年度报告[R].2023.
[4]司马碧荣,邓大政,杨媛.Python在电子表格中数据比对的应用[J].信息与电脑(理论版),2022,34(15):107-111.
[5]张晓芳,董坤景,赵丽娟.Python技术在财务分析中的应用研究[J].邯郸职业技术学院学报,2022,35(4):38-41.
后台-系统设置-扩展变量-手机广告位-内容正文底部 |
-
<< 上一篇
下一篇:没有了!