(学生记者王滢张芮)6月11日-12日,6163银河.net163.am“研究生数据处理与学术能力提升训练班”在文泉楼南104、105教室顺利进行。本次培训由李春涛教授及其团队博士生主讲,授课对象主要为研一新生,100余名学生参加了此次培训。开班仪式由胡宏兵副院长主持。
首先,胡宏兵副院长介绍了本次培训的目的及意义,接着李春涛教授向同学们分享其在香港大学、华中科技大学的求学历程以及个人数据处理能力提升的经验。课程伊始,李教授对stata、python等软件进行简要的对比,对stata进行重点介绍,接着从不同格式类型数据的读入开始,分别介绍了运用infile、insheet、import等命令,将txt格式、excel格式等类型文件导入stata时可能遇到的问题及解决方式。
11日下午,李教授对授课内容进行进一步深入讲解,首先以爬取单个上市公司公告为案例,向大家介绍如何对网页源代码进行解读,在stata中爬虫获取所需信息。接着李教授又对forvalues、foreach等循环语句的使用进行讲解,再次以爬取上市公司公告为例,利用循环语句批量获取多家上市公司相关数据。最后老师对post命令在stata中发挥的重要作用进行了深入讲解。
12日上午,博士生闫续文带领同学回顾前期课程内容,随后,对stata回归分析及结果输出进行讲解,对putdocx命令输出内容至word文档、编辑docx文件中的文字内容、输出绘图等进行介绍后,引入 putdocx命令相关案例,讲授了输出十进位制下的汉字unicode编码、结合常用汉字生成随机汉字组成的段落等问题,最后讲解了实证结果输出和完整展示。
12日下午,华中科技大学博士生薛原对网络数据的抓取进行重点讲解,分别以上市公司公告的抓取、上市公司高管任职信息抓取、深交所信息披露考评数据抓取、港股交易数据抓取为例,深入细致的讲解了利用stata进行网络数据抓取的方法。
通过两天的stata学习,同学们进一步加深了对stata强大功能的认识,提高了数据处理能力,本次研究生数据处理与学术能力提升训练班圆满结束。