我的毕业论文选题和文献审读方法,你可能也会用得上

我的毕业论文选题和文献审读方法,你可能也会用得上
2021年04月13日 11:24 少数派sspai

Matrix 首页推荐

Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。

文章代表作者个人观点,少数派仅对标题和排版略作修改。

开始前

生命科学类专业本科论文,论文类别是系统性综述和元分析。出于隐私保护的考虑,模糊、修改了一些细节。之前没有相关的科研训练和相关经验,所以预期是对高中以上大四以下的朋友们有用。如果有什么不完善的地方,欢迎各位指证。

如何确定选题

我的导师是没有给选题的,第一次见面的时候,给了我一些大致选题的方向,然后让我自己做了研究后告诉他我的决定。

对于我的研究问题,导师希望是 PICO structure1,即「某种药如果用来治某种病的话会多有效」。PICO的具体意思如下:

P研究对象(Population, Patient or Problem)
I治疗方法(Intervention)
C对照组(Comparator or Control)
O研究结果(Outcome)

因为我没有特别想做的方向,所以除了看一看导师给我的那些课题之外,还广撒网式的去看了其他文章。我用到的网站有这些:

New Scientist ,一个科技周刊,网站上常发布各个领域的最新研究进展。

因为我的专业是生命科学,所以我会进入在 Health 这一栏下面挑感兴趣的文章点开看。

文章中通常介绍了这项研究的相关背景和最新发现,并且在最后会附有参考文献。如果一篇文章讲的内容让我十分感兴趣,我就会顺着文章找到原本的文献,再以这个为起始做更多的研究。

知名期刊官网

这个一方面可以通过之前的经验积累,了解到领域内有哪些知名的期刊,另一方面也可以在顺着期刊的影响因子顺着向下查。

这里我使用的是 NIH 提供的列表,基本上生物和健康的各个领域都有涉及,我选中了那些名字看起来像是医学、健康、生物、脑神经科学相关的点进去看。

在官网通常会有最新发布的文章列表,浏览之后或许能找到感兴趣的话题。

面向患者的医疗网站

在这些网站上则是从病情入手了。

这两个网站都提供相对比较全的病名列表,我会随机找各种病点开看。

如果发现值得研究的病症的就记下来,在论文库里面读一些论文,看这些病是否有值得深挖的点。

如此一番下来,我的手头上留下了五个病和药的组合。

我会针对这个组合读一篇五年内的综述。如果有来自知名期刊的最好,它们出品的文章通常结构清楚、语言简练。如果没有也不强求,找一个高引用的就好。

读文献综述的过程里,可以加深对这个病和这个药的了解,并找出现有的可能存在的研究空白,然后看看这一点能否发展为我的论文课题。

我收集的信息一般有:这个病是什么,这个药是什么,它为什么能治这个病。除它之外还有什么其他类别的药可以治这个病,这些药的原理和效果有哪些不同,各自又有哪些不足。

在对这个病和药有了足够的了解之后,就可以顺着参考文献列表一个一个去找「值得一做」的主题,大概读一下摘要和导语,看作者是否在其中提到了现有研究的不足,或是未来发展的可能性。这些通常都可以拿来发展成我自己文章的核心问题。

在导语中,通常有这样一个句式:「大部分的文章都集中于讨论 A,但是我们发现它也是有局限性的」。在摘要中,则是:「今后的研究可以集中在 B 领域……」,诸如此类。

通过这些文献的积累,最终确定下来每个主题下的一个主攻方向。

最后,再根据这些方向和可能的 PICO 关键词组合,放进文献库里面搜索。如果在这里找到了文献数量少的主题可以考虑舍弃,不然到了写作部分会很难展开。

如此下来,我剩下三个主题。我对每一个都写了简短的笔记,说明现状、问题,以及文章可以怎么展开,跟导师一一讲了。导师在听过我的陈述之后替我定下了一个主题,并和我一起想出了一个比较有科研味的题目,就可以开始准备了。

PS. 虽然有些主题最终被舍弃掉了,讲这些的综述也不要急着删,写得好的可以酌情留下,作为后面写作时候的参考。

文献搜索和整理

确定主题之后,就可以找相关的文献了。

搜索的时候我用到了 MEDLINE 格式进行的高级搜索。术语在此不再展开,我使用的教程包括:本校和外校的图书馆,以及一篇介绍性的文献2

我用到的数据库是:PubMed, Scopus, ScienceDirect, Web of Science.还有一些用来查找未发表的文献:BioRxiv, Opengrey, eTHOS.

此外,如果经常遇到同一个名字,那么说明这个人肯定在这个领域内有一定的话语权。顺着这个人的名字继续找,有的时候还能发现不一样的惊喜。

同样地,在读文献的时候也可以扫一眼参考文献列表。有的时候可以借此发现没有被数据库收录的文章。

我做的这个主题更新换代的速度没有那么快,所以最后用到的都是在普通数据库里找到的文献。

在搜索的时候也可以选择「接受提醒」,这样未来一旦有了符合搜索条件的文章,就会发邮件通知你。PubMed 的按钮在这里,其他数据库应该也有类似的功能。

在各个数据库搜索过后,导出文献列表,丢进文献管理软件,然后选择「删除重复文章」,就可以开始阅读了。

此时放进软件的也不一定要下载了 PDF 文档,只要标题和摘要完整就足够了。

按理说,如果文献不多的话,在数据库的搜索结果里面一个一个读了之后,选择性下载也是可以的。但是这么做的话,如果搜索结果或者网络波动,非常容易丢失进度,可能会影响最终收集到的文献总数。

虽然说糊弄过去也是可以的,但写论文的第二步就开始糊弄了,是不是不太好……!

下一步就是对已下载文件的初步筛选。

(这一步和读文献都很无聊,而且很费精力,建议手边常备甜味零食和水源,家里夜宵速食储备充足。设好闹钟不要久坐,保证睡眠充足。一个人住的话最好把吃饭/点外卖的闹铃也定上,定期和朋友联系以确认自己不会孤独猝死家中。)

在文献管理软件里,我分了几个文件夹:

未读写引言的时候会有用符合要求,正文要用未来可能的研究方向参照物已读无用待定

在简单读过一遍标题和摘要之后,就要把文章按照他们的内容放进不同的文件夹里。

写引言的时候会有用」的一般都是领域相关,但是侧重点几乎没关系的地方。

符合要求,正文要用」的文章需要和我的 PICO criteria 完全匹配才会放进去,这里面的数据也是最终会被用到和分析的数据。

未来可能的研究方向」一般也是领域相关,不过可能侧重点在新型疗法或者前沿科技,比如干细胞之类的。

参照物」里面放的都是我读过之后觉得作者写得非常好的文章,不一定和研究领域相关,但用词、句式、结构都或多或少的有可参照之处。这样在写文章的时候,如果想不出该怎么写,就可以点进去学习一下。上面说到把主题舍弃不用,但内容很好的综述留下来,也是要放到这个文件夹里的。

而有些文章一看题目就知道它和我想要做的毫无关系,在确认过摘要后还是毫无关系的就丢进「已读无用」这个文件夹。其它的就按照它们或许有用的类别丢进相应的文件夹里。

如果读过题目和摘要之后还是不确定,就放进「待定」,等筛过一轮之后再精细阅读。

第二遍读的时候,就要读正文了。

我读的顺序是:引言中的最后一段(Aim)→ 结论 → 方法论 → 结果。

遇到合适的,还要根据我的 PICO criteria 一一对照检查:是否是我做的目标人群;是否是我做的那个药;是否和我有一样的对照组;是否有我需要的研究结果。

如果有余力,可以重点关注一下「方法论」里面给的各项数据是否齐全且一一对应。我这次就是在写作的过程中发现有个作者的对照组没写参与临床试验的人数,而神奇的是审稿人也没发现,让我一口老血吐出来……

这样再筛一轮之后,「未读」「待定」两个文件夹里应该就空了。此时就可以进入精读部分了。

读文献

就需要下载文献的全文了。我会把它们放进电脑和 iPad 端可以同步的软件,然后慢慢读。

对我来说,要用的文献都是临床试验类的。所以我在读的时候,会格外关注:

研究对象的分布(年龄、性别、……)药品剂量、频率、给药途径成果和相关衡量标准

这些信息就分别用一个颜色的高光笔标注。一定要把颜色分得清清楚楚的,不然后面找起来会很费劲。如果有可能的话,实验组和对照组最好也用不同的颜色。

其他的比如「作者对这个结果的解读很有意思」「这点可能造成偏差」,也用别的颜色标注一下。

如果有需要做「偏误风险评估」(Risk of Bias Assessment),可以在读文献前了解一下相关的标准,这样在读的时候也能做出相应的评估。

一边标注,也要一边总结。

我建立了一个 Numbers 文件,记录我在读文献中总结出来的要点。表格题头如下:

Ref code参与者用药实验结果1实验结果2……备注

「Ref code」里就是我给每一个文献设定的 reference key,方便使用 BibTeX 写引用。

所有的「用药」相关问题都放进了同一栏,包括了剂量、频率和给药途径。

「备注」里面会写一些我认为需要注意的地方,比如某一篇用的测量方法和其他不同,诸如此类。

之后还有一些亚组分析,用的也是类似的格式。

值得注意的是,有些文章在分析实验结果的时候用的是标准差(SD), 有些用的是风险率(RR)。这两个是不一样的,所以记录的时候要注意标注。

偏误风险评估的表格是这样写的: 

空白Ref code 1Ref code 2...
标准 1
标准 2
...
备注

因为每个标准的名字都很长,为了方便阅读,选择了这样的排版样式。

读到了就记一下,并不追求读过第一次就全部写完。

「备注」里面可以简短地写出这样判断的原因,以及任何不寻常的地方。

每一个表格内填写的会是:高风险、低风险、不确定风险(unclear risk of bias)中的一个,我在软件中设置了「条件高亮」,这样填写之后每个格子就有自己的颜色,更方便阅读。

读的时候也可以想想,作者的发现我可以怎么用在文章里,有哪些地方是可以用来讨论的。我把这些想法统一丢进了备忘录里,暂不管可行性,就放在那里,之后写作的时候再来考虑。

另外,读文献的时候发现很多都用到了森林图、异质性和发表偏差,于是作为读论文的调剂,学习了一下这些都是什么、在论文中可以怎么用。

推荐几个视频,都是我看过觉得有用的(都是英文):

森林图:https://youtu.be/py-L8DvJmDc异质性:https://youtu.be/KSKCTXciGjI发表偏差:https://youtu.be/UUk0zas0VL4

在 Cochrane Handbook 中也有相应的文字版,但是我没怎么看懂,所以还是推荐视频。

如何审读一篇论文

因为导师偶尔会让我给他分析一篇文章,所以我也总结出了一个自己的模版,做 PPT 也是基于这个思路来的。见面和展示都非常不正式,所以仅供参考。

我使用的整理软件是 Scrivener,其他软件比如 Notion 或者 Evernote 都是一样的。下面的部分会以实验类文章为例。

在 Scrivener 中新建一个文档,输入模版,调整格式后会得到一个大概这样的文件:

选择「文件—保存为模版」,在下次打开的时候就可以直接从模版库中选择。

因为我需要做研究的领域并不是很多,所以我把所有都放进了一个文档里。如果需要做许多方向的研究,可能每个方向都单独设定一个文档比较方便。

建立成功之后,右键复制(Duplicate, ⌘D)即可建立一个新的文档。我的习惯是把文档名字改成「第一作者+年份+文献关键词」。

在记录的时候也不用追求句子的完整性,自己能看懂就可以。

首先每个文献都要有的:标题总结

「标题」自不必说。如果读的文献是外文,则最好把原文题目也粘贴进去。

「总结」里的内容我一般会放到最后再写,就是用我自己的话概括全文的中心思想,方便后面搜索文献的时候很快抓住重点。

这部分通常包括了:方法实验对象结论其他发现

比如这样:「方法论引自 Brogan 1998,剂量增至 20 mg/d。显著减轻症状(测量方法 X),对治愈率和诊断后生存天数的提升不明显(在临界值,Y% 和 Z 天)。参与者年龄跨度大,有性别差异(生存天数),未做详细分析。」

之后我会给文献分一下类。我读的以实验类为主,也有少部分是表达作者观点的文章。

对于实验类的文献:

研究目的:作者想解决的问题是什么?方法论:作者是如何设计研究的?是否基于以前的方法?是否有任何改进?评估:作者如何评价他们的方法?试验是如何建立的?有无问题?有无可以参考的地方?结论:作者得出了什么结论?在多大程度上解决了作者的研究问题?解决方案的力度如何?上面未列出却的值得注意的地方(可选)。或许可以参考和研究一下的相关文献(可选)。

研究目的

这部分通常可以在摘要或者引言的最后一段里找到。

作者解释此前的研究空白,并解释他们做这个实验是想要解决什么样的问题。

句式通常是「We aim to …」

方法论

这里的内容都是从文章的方法论一节中找出来总结的,我倾向于用自己的话简短总结。为了方便导师提问,有的时候也会讲得细致一点。

一般来说,临床试验都有标准的规章制度,所以区别不大。看过一篇完整的临床实验方法论之后,遇到使用同一个标准的文章,就可以把之前做过分析的笔记链接过来(⌘L),省时省力。

动物实验通常没有一个固定的标准,所以试验方法可能会五花八门。如果作者用了前人的方法,就在文中会引用相关的文献,需要的时候顺着找就可以了。

虽然说这在这一部分里列出了三个问题,但我会直接写成一个整体的部分。比如:3

图中的大字是我认为这篇文章需要注意的部分,而小字部分是导师可能会提问我的细节,所以放在这里以备不时之需。

如果在这部分里出现了存疑的地方,高亮一下,在下一部分的「评估」里面详细分析。

评估

这里就是根据在读方法论的时候发现的不完善、或者感觉不对劲的地方。

比如:人员的选取是否有代表性、给药的时候是否保证在每天的同一个时刻喂的,按照学科有所不同。

如果不熟悉的话也可以参考一下「偏误风险评估」里面的标准。

结论

作者得出的结论一般都放在文章最后,摘要里也会有简短的一句。通常来说,作者也会解释这个实验在多大程度上解决了他们的研究问题。

如果想要加一些自己的参考,或许可以试试用作者给出的数据得出自己的讨论点和结论,再和作者的相互对照。这么做不仅可以帮助分析结论的力度,还能学习其他研究者是如何对数据进行分析并得出结论的,对初学者比较友好。

另外,如果在阅读期间出现任何不确定的测量方法,高亮一下(最好和其他的高亮颜色不同),读完之后研究一下,比如「数值大的意思是好还是不好」这种。

对于观点类的文献:

作者的主要论点是什么?有什么证据支持作者的主要论点?反对作者主要论点的证据是什么?他们是如何支持这个论点的?作者是如何得出最后结论的?证据和证明的力度如何?

5、6 点同上。

观点类文献我读的不多,所以这里只是简单介绍一下。

这类文献的文体都比较统一,开头一个中心句概括这一段的内容,后面引用不同的观点来支撑证明中心观点。

如此,每一段都可以分析一下论点和论据的可靠性,最后再来看结论。

模版里面的大部分问题都集中于「作者是怎样用那些论据论证的」。这里主要是观察作者的逻辑链。比如:

作者的观点:在网上获取新闻比其他媒介更好。论证方法:网上的信息更有时效性,其他媒介出新闻的时间慢,所以网上看新闻更好。

但是这个逻辑链条里忽略了网上有可能有虚假信息,导致新闻不准确的可能。而且没有对「好」给出定义,所以这里的论证就不能算是「有力」的。

读完全篇之后,就可以根据刚才的分析写出「总结」:

「作者认为在网上获取新闻更好。因为这样获取的效率更高、时效性更强。虽然有大量的虚假信息影响判断,但是新闻最重要的还是时效性。讨论的其他媒介有:报纸、电视、口耳相传。前两者的真实性有足够保障,但是时效性不强;口耳相传则没有上述媒介的任何优点。」

小结

总的来说,如果掌握了足够的技巧,确定选题、找文献、读文献并不是一件难事。这个过程中最痛苦的地方其实是不断地整理、分类、总结,并从中发展出自己的想法。

希望经过我的分享,能给你带来启发,或者让你的流程更加高效。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部