对于模型、实证分析一窍不通，该怎么写一篇带实证分析的论文？

千姿百态 · 发表于 2024-11-8 21:32

登陆有奖并可浏览互动！

您需要登录才可以下载或查看，没有账号？立即注册

×

急！本人大二经济学类，我要写一篇带实证分析的论文，但对于模型、实证分析一窍不通。想问大佬们该怎么开始啊？

原文地址：https://www.zhihu.com/question/532772863

大力水手 · 发表于 2024-11-8 21:32

如今本科毕业论文要求越来越高，心理学金融学等大量学科要求通过实证分析完成毕业论文，来找我咨询这方面的问题的同学很多，这里着重讲解一下。
<hr/>实证分析的过程就是利用模型拟合数据达到自己预期的结果，论文实证的模型主要有：普通回归，静态面板回归，动态面板回归，门槛回归，断点回归，两阶段回归，双重差分回归，分位数回归，逻辑回归，空间回归，结构方程还有时间序列等一系列的处理方法；确定权重计算综合得分的模型主要有因子分析，主成分分析，熵值法，层次分析法还有综合迷糊评价法等等，本科生应用的模型可以稍微简单一些，普通回归，静态面板回归就差不多了，研究生毕业论文的模型要复杂一些，目前门槛和断点模型运用的比较广泛。
  实证分析这一章直接决定了整篇文章的价值以及这篇文章能否顺利进行下去，因此对于现阶段的论文来说，实证分析章节是一篇文章最为核心的部分，也是每一位写毕业论文的同学应该最先处理的一个章节，只要这一章的内容搞定了，整篇文章水到渠成。
  为什么说实证部分最重要应该最先写呢，第一，实证不通过整篇文章是没有意义的，没有写下去的必要，可能需要更换主题；第二，实证一旦通过，你最担忧的问题已经解决，并且你已经读了一些的文献，你对研究的主题有了较深的认识，整篇文章你已经做到了心中有数。因此，各位同学，如果有实证要求，请一定先写实证部分，即使不写，也要把数据处理的结果先做出来。
  如何做实证分析呢，首先一定明确自己的研究主题，因为研究主题一般就确定了实证模型的因变量和核心自变量，比如说“养老金收入与农村老年人口的劳动供给--基于断点回归的分析”，从标题中，我们可以确定文章的因变量是农村老年人口的劳动供给，自变量养老金收入，用到的模型是断点回归。
  那么首先要确定的问题是如何量化农村老年人的劳动供给，就是用什么数据来进行衡量；养老金收入用哪个数据来衡量，然后就是断点模型的运用，一般来说文章内容就会给出数据的来源是什么，各个变量是如何衡量的，以及实证分析的过程。
再找5篇左右的相关文献，就可以确定因变量，核心自变量的衡量方法，以及具体的实证过程，读多篇文章还有一个目的就是要确定模型的控制变量，因为影响因变量的因素除了核心自变量以外，还有其他的因素也会产生影响，那么把其他的影响因素找出来并进行量化，这些就是控制变量，加入控制变量可以使得模型更准确，更完善。
  到这里，基本上实证的数据来源，变量模型的选择以及实证的过程就基本确定了。剩下的就是找数据，清洗数据再拟合数据了。一般来说，实证很难一次完成的哦，需要尝试多次，但是财务金融数据以及一些高校的问卷调研数据往往都可以得到理想的结果。
文章的整体结构可以这样划分。
第一章绪论。包含研究背景，研究目的研究意义，国内外文献综述，研究方法，技术路线图等等，可以根据自己学校的要求进行适当的添加内容，一般这几部分都够了的。
第一章是凑字数的重要章节，第一章的篇幅如果能占到要求字数的1/3以上的话，那么后面的内容写起来就会很轻松。
那么查重怎么办呢，这个不用担心啦。首先不建议先写出来再去查重，除非时间来不及。
具体可以这样处理：论文研究背景和研究目的意义的字数尽量达到1000-1500字左右（小四字体，1.5倍行距下，word一页大概是900字左右哟），国内外文献是主要凑字数的地方，首先写相关内容的时候就要有意识的将文献的句子用自己的语言进行转换，其次可以多参考外文文献，把外文文献翻译成中文，那么你的查重率会非常低。要是看不懂外文文献又必须要参考外文文献怎么办呢，其实很简单啦，直接参考期刊上的外文文献，把期刊上参考的外文文献拿进来，还是要用自己的语言转换以下哦。8000字的论文，国内外文献综述可以写到2000字左右，3万字的硕士论文，国内外文献可以写到8000字左右，这样的话就不用担心整篇文章的字数不够了。当你先做完了实证之后，研究方法和技术路线图就已经出来啦，技术路线图有条件的建议用visio哦，当然word也是可以的啦。
第二章。概念界定以及相关理论研究这一部分，介绍核心研究问题的概念以及相关理论。
第一部分就是概念的界定，往往只需要介绍核心变量的概念就可以了，仍然以“养老金收入与农村老年人口的劳动供给--基于断点回归的分析”，首先要介绍农村老年人口劳动供给是什么意思，应该如何理解就可以了，其次要介绍养老金收入的概念，当然这个概念比较简单，是可以不写的，如果文章还有其他比较重要的概念，也可以一并写上来。
第二部分就是相关理论研究，一般通过前面的文献综述，你已经知道了很多和你论文主题相关的理论，这一部分的写法有两种：第一通过多篇文献的内容总结出某个理论的内容，第二直接百度理论内容，然后复制过来，就是这么简单粗暴。
第三章。研究假设章节，将自己研究的问题以假设的形式提出来，然后通过实证章节来验证。
这一部分章主要就是把自己实证的观点提炼出来，整理成不同的点，然后提出论文的假设部分，有些文章研究的内容比较单一，因此这一章并不适用所有的论文。
假设的提出需要有论文的依据，由于前面文献综述部分已经有了大量的文献内容，因此这里的文献就不需要写那么多啦，一个假设配上400-500字的文献综述内容就可以了
第四章。研究设计章节，这一章主要介绍数据来源，变量选择以及模型说明。
这一部分首先就要介绍数据的来源，把数据的来源，数据的筛选，最终保留的数据量等信息都要写出来，这个参考一下其他的一些论文就可以啦。
第二部分介绍变量，主要包含因变量，自变量和控制变量的介绍，要把变量的衡量方式写出来，这样才会更详细，字数也会更多。
第三部分写模型，首先介绍为什么使用这个模型进行处理，其次介绍模型的原理，最后写一下回归方程表达式就可以了。
第五章。实证章节，主要有描述性分析，相关分析，模型回归分析以及稳健型检验等内容。
实证分析一般来说套路都比较固定，这一章也是凑字数很重要的章节，所以建议在写这一章可以在主要的回归模型上，做分组讨论，异质性分析等内容，比如说分性别进行回归、分企业性质进行回归，研究一下调节效应或者中介效应等等，总之扩充实证的方法有很多，在阅读文献的时候就要留意这些处理方法。在很大的程度上这样可以极大的丰富实证的内容，而且实证部分的查重会非常低，因此实证部分能多写就多写。
第六章。对策建议部分，这一部分首先写一下研究总结，把整体文章的思路回顾一下，再把主要的研究结果分点论述，然后就要写对策建议，对策建议需要根据实证研究所得出的结果来进行论述，一般来说，答辩老师b比较看重这一块的内容，需要用心去写。
最后就是参考文献和致谢部分了，这个就很随意了，等所有的都写完了，在回过头来写摘要，这样的话整个文章就完成了，另外每一个章节都要有本章小结哟，这样文章的内容会更合理。
一篇毕业论文的写作并不难，只要思路清晰，实证处理没有问题，那么很快可以完成。为什么第一章和实证章节要凑字数呢，因为一般来说其他章节写的内容真的很少。

检验医师 · 发表于 2024-11-8 21:32

最简单的办法就是多看文献，根据文献最开始是模仿，然后再加入自己的想法
这种模仿不是照搬照抄，而是注重看文献的结构、用法、说法、实证部分的表格用法、实证常用的框架；这些东西看似摸不着头脑，有点复杂，但实际上是很好理解的，只要耐住性子去看。
经济类实证分析文章只分为前言、文献综述、理论分析和实证分析、结语几部分，我也从这几部分开始讲，因为本人也是经历过这样的过程，所以分享一些自己觉得很实用，也不是大佬才能做得方法。
首先，先确定大方向选题，然后进行数据收集，一定是简单且容易的数据收集。首选宏观数据，省级年度数据，也是最好处理的数据。然后进行初步数据回归，查看结果与预期是否相符，相符的话开始写。
文献综述：
第一步：花2个小时时间找到相关的文献统一下载
第二步：统一时间看所有文献，建议首选选一篇C刊文章细读，然后其余文章选择性读，比如要写文献综述的时候，就统一读一遍所有相关文献的引言和文献综述；
第三步：初步写文献综述
数据实证部分：
第一步：收集数据，国家统计局，统计年鉴去搜索，注册一个账号下载都是免费的。建议所有文件下载以后都要重命名，因为后期数据会很多，容易弄混或者忘记
第二步：将数据整理成stata识别的格式（可以通过excel快速整理）
第三步：导入stata进入试跑，不同的模型会有不同的命令，一般常有的ols就是reg，xtreg，还有高级的，这个后期单独出一期说明。
第四步：对于数据显著的可以直接通过导出命令导出
stata有很多很多模型，一般我们在确定题目的时候就会已经想好本次采用哪种作为主要模型，比如一般涉及到政策就是DID，一般涉及到污染类绿色经济就是空间计量模型。这里推荐一个人：连老师，无广，无广，纯属自己看知乎找答案比较好的一个。还有经管之家也不错。
https://www.zhihu.com/people/arlionn连享会
这个过程是一个不断摸索的过程，确实一开始会不太容易，但是每一次就给自己一个小任务去完成，就会容易很多

检验医师 · 发表于 2024-11-8 21:33

最简单的肯定是城市统计年鉴跑did（双重差分法模型），各种did方法已经下沉到本科生了，以前的大佬们好像以为本科生阶段模仿就行了，但可能不知道现在的计量流水线内卷下沉地多厉害。

看看今年的丘成桐中学奖，高中就开始did了，此时不D，更待何时？

丘成桐中学论文入围名单传统did，交叉did，多时点did，渐进did，三重差，各种花式did任君挑选，
然后注意下多研究平行趋势检验和安慰剂检验，有余力就搞个倾向匹配法。都是为了求个“稳健性检验”，
实证就是这么“稳”这么“健”（）
百度，经管之家，微信搜索（连享会，计量经济学圈这些），谷歌，GitHub，B站，到处都是教程，所以我也感叹下沉的厉害，现在比的似乎是互联网汲取能力了。
最离谱的是，通过复刻计量代码，你可以在不知道模型推导，对代码一知半解的情况下把图和计量结果跑出来，只要会解读就行了。
城市面板数据到处都有，城市政策更是随便找（创新城市，智慧城市，宽带中国，产业园区试点，低碳城市，，），再安排上四大区域或者胡焕庸线，城市等级排序划分作为异质性分析，这些的Excel匹配表网上到处都是，完全流水线，，，闲鱼一大推数据。代码可以闲鱼找，也可以看中国工业经济（经管之家很多付费代码，个人感觉都是GitHub搞下来的。
DID搞的就是政策，政策怎么个好法，怎么个重要价值呢？十四五规划、中央一号文件、人民日报网、求是网、xx大报告专家解读，去把自己的政策扒拉一下，文章政策背景、意义、分点阐述都来了。
很多论文做过每个城市的产业集聚地，共同富裕度，创新创业度，找来拿来做自己的中介变量，反正大家都是变量换来换去。
有些人找老师要数据，以为是机密当个宝还遮遮捂捂，其实淘宝闲鱼早就传开了，国内很多微观数据库也是公开的，用学生邮箱去官网申请即可。
本科生也就靠这些灌水了。
Y，反正什么指标都可以用Stata通过熵权法和主成分法构建指标，网上造好的轮子一大堆。没啥说的。
Python的话最近流行的是企业数字化转型的文本分析，闲鱼三篇论文的数据和代码也是到处都有。
很感叹去年学校前年还是Eviews跑回归就可以了，去年已经变成Stata跑，并且稳健性，异质性都要求严谨得会了。然后今年又开始吹Python才是未来。让人头大。（我怀疑一些招学生要求必须会Python的老师自己都不会）
个人认为did的平行趋势和安慰剂检验比一般的稳健型检验好学，因为其他模型的工具变量和内生性处理很难。
PSM匹配，中介效应，区域异质性这些已经被用烂了，绝对不缺代码，看现在的硕士毕业论文基本都有，已经到了泛滥的地步。
会了did后可以看下空间计量，看起来高大尚，其实就是封装几个矩阵。我个人对不使用遥感GIS的空间计量很怀疑。个人对GIS有兴趣但电脑内存不够了，想用Python糊。
身边不少人计量之外就是搞机器学习去了，都是跟着上面卷方法罢了。
有了GPT后很多代码其实都很好跑，最近我弄自己的一部分数据的描述统计，代码图都是让GPT帮我搞了。最近也试着让GPT教我机器学习的pca和pcr，效果也不错。
<hr/>曾经也是以为学了计量就算入门，但自己跟着流水线做了几次感觉也就那样，卷方法只是永无止境的降维打击，理论和思想才是灵魂。
但所谓的经济学思维又是啥呢？感觉和高考的学科素养一样缥缈又散发着玄学的气息。
所以经济学自己的培养方案在干啥？
——被计算机，数学，物理的跨考的人才疯狂入侵。学科素养缥缈，数理方法又卷不过人家。
但有时候，选择有趣的变量或许普通ols都够了，最近看一些用劳务合同，婚姻作为变量的论文，方法简单，但确实挺有意思的。
这时候你又会不自觉地看着自己的论文花里胡哨，就像孔乙己那样用四种方法写了个“茴”字。这一刻，我感受到了世界的参差。
经济学实证论文到底定位是什么，感觉大部分学校都没有讲，就是通过要求去本科生卷方法，卷流水线。现在又开始推销Python，学来干啥，机器学习之外大部分是用来跨考CS，逃离经济，就等着自毁根基吧。

推荐看这个，让我觉得作为本科生差不多学点方法就OK，更多的还是得提升自己的理论素养，我就感觉自己的理论素养实在太差，实证写得是乱七八糟，生搬硬套。别老想着用实证来发现理论，而应该用实证来检验反驳理论。
计量喜欢声称自己是“因果分析”，统计只是“相关性分析”，但现在大家都是拷打数据，说到底实证论文作为“理论检验”的定位就没摆正。
实证论文，验证性才是关键。
做了几篇实证都是拷打数据性的显著，你不显著我有的是办法让你显著！什么让子弹飞的体面（）
实在是违背了当初学经济初心啊。
给搞实证研究学者的经验建议, 为什么和如何做实证研究<hr/>其他写作相关：
一份经济微观数据库的数据清洗快速指南关于CiteSpace的文献可视化 Word替代LaTex？客观赋权：PCA、CRITIC、EWM、COV

大力水手 · 发表于 2024-11-8 21:33

写在前面：
本回答以个人实用和实践为主，如有错误请勘误。
首先，你需要圈定你的主题，本科生我们就简单点，例如XX对XX的影响，即实证研究是研究A对B的影响。然后你就要去知网找类似的论文，一定要找CSSCI，最好看一下期刊影响因子，过6最好，把方法和行文逻辑模仿出来。
其次，你的模型我建议你用stata去跑，不会就学，不要看b站，除了别人搬运的连玉君的视频，否则意义不是很大，没啥东西讲的。用陈强的高级计量经济学和stata应用这本书，当工具书用，注意Heckman检验这个他可能有错误，其他的都是对的。也善用连玉君的网站：精彩资讯- 连享会主页 (lianxh.cn)
然后你就要学OLS，Probit，Oprobit，DID这几个模型就行，这几个模型够你用到研究生毕业了。注意，如果Y是0，1变量用Probit，0，1，2，3，4这样的用Oprobit，其他的用OLS。DID是一个方法，检验政策的有效性的，有点点难度，可以后面再说。
数据你就走公开数据库，如果是公司的话就是国泰安，resset。个人调查问卷就是CFPS，CHFS，不过这些数据处理比较复杂，建议还得好好学习处理方法。
第三，由于新手上路，最难的就是写引言开头的几百字。你的逻辑一定要清晰，在引言部分一定扣好帽子，从大到小，然后以小见大。讲清楚为什么你要研究这个，研究这个的意义是什么，研究这个有什么好处，你的文章贡献在哪。
第四，文献综述，可以参考我写的这个回答：各位大佬第一次写文献综述写了多长时间？ - 千金难买我高兴的回答 - 知乎 https://www.zhihu.com/question/541046790/answer/2554800195
第五，回归分析，看我这个回答：怎么看回归分析结果? - 千金难买我高兴的回答 - 知乎 https://www.zhihu.com/question/531302693/answer/2470107972
还有描述性统计：描述统计的图表为什么要这么做? - 千金难买我高兴的回答 - 知乎 https://www.zhihu.com/question/570733986/answer/2791559905
第六，就是稳健性，异质性，进一步分析。
稳健型简单来说有这样几种：第一换变量，换x，换y。第二加固定效应。第三增加或减少样本量。
现在内生性也算在稳健性中，内生性最好用工具变量（IV），实在不行就用heckman，psm等方式
安慰剂也算是稳健性。
稳健性可以参考：稳健性检验！稳健性检验！ - 连玉君的文章 - 知乎 https://zhuanlan.zhihu.com/p/343111466
异质性有分组异质性和调节异质性，自己搜
进一步分析就是机制分析什么的，连享会都有

同花顺 · 发表于 2024-11-8 21:34

好的论文不一定需要复杂的模型，我建议题主做这几件事：

对你的数据做做描述性统计和散点图，看看选题是不是可行。
用最简单的OLS模型跑一跑，看看核心解释变量是不是显著的；如果显著，就不需要用什么复杂的模型，如果不显著，筛选下变量再跑跑。如果还是不显著，问问论文合作导师（论文发表的情况下），或者问问青椒（交作业的情况下）。我觉得本科生应该能理解做交互项、做固定效应，以及DID、中介效应模型（你别管别人怎么批评，在这个阶段不重要）等简单的方法的，如果老师提供的解决方法很困难，就换题目。
如果显著，去中文顶刊上找文章，看看别人是怎么做稳健性检验的，特别推荐经济学季刊。如果不投，只交作业，可以根据字数要求略去这一步骤。
如果字数不够，可以看看有没有相关英文文献是做这方面的理论模型的，将与实证结果符合的理论模型加在实证前面。我觉得把这个模型报告清楚就可以了，未必要有很重要的创新。

数据集的大小并不重要，我甚至看到很多用省级面板做OLS拿到硕士学位的，本科写的小文章就是学个方法。如果回归跑不出来，迅速换题，重新找数据，应该也用不了很多时间。用公开数据，做做前人的老题目，只要不发表，也是很好的。

图文播报

[分享] 对于模型、实证分析一窍不通，该怎么写一篇带实证分析的论文？

登陆有奖并可浏览互动！

发表回复

浏览过的版块

官方推荐 /3

个人中心