欢迎来到格策美文网

毕业论文的读书笔记如何写我教你。(精选5篇)

更新日期:2025-06-06 05:14

毕业论文的读书笔记如何写我教你。(精选5篇)"/

写作核心提示:

写一篇关于毕业论文的读书笔记作文,应该注意以下事项:
1. 明确主题:首先,要明确毕业论文的读书笔记作文的主题,即论文的核心观点或研究问题。这有助于你在阅读过程中有针对性地记录和整理相关信息。
2. 结构清晰:读书笔记作文的结构应清晰,一般包括引言、正文和结论三个部分。引言部分简要介绍论文的背景、目的和意义;正文部分详细阐述论文的主要观点、论证过程和结论;结论部分总结全文,强调论文的价值和贡献。
3. 内容丰富:在阅读论文的过程中,要全面、深入地了解论文的研究内容,包括研究背景、研究方法、研究结果和结论等。同时,要关注论文的创新点、不足之处以及与其他研究的对比分析。
4. 突出重点:在读书笔记作文中,要突出论文的重点内容,如核心观点、关键数据、重要图表等。这有助于读者快速了解论文的核心思想。
5. 逻辑严谨:在阐述论文观点时,要保持逻辑严谨,遵循论文的论证过程。注意使用恰当的连接词和过渡句,使文章结构紧凑,条理清晰。
6. 引用规范:在引用论文内容时,要注明出处,遵循学术规范。可以使用脚注、尾注或参考文献等形式进行标注。
7. 个人观点:在读书笔记作文中,可以适当加入自己的观点和思考。这有助于展示你的学术素养

快来看,论文阅读笔记应该这样做!

“优秀网民代表”“微博段子手”“颜值博主”“青年潘长江学者”“B站新星up主”“驴肉火烧野生代言人”......提起新传学界的小董老师,很多考研er都能联想到其诸多外号。

今天我们推荐董晨宇老师的新闻传播学论文阅读讲座,觉得非常有启发,分享给大家一些收获。


01.

读什么?

文献积累的方法


重点一:跟踪高质量的新闻传播学学术期刊


《国际新闻界》《新闻与传播研究》《新闻大学》《现代传播》《新闻界》《新闻与写作》《新闻记者》等。除此之外,香港地区的《传播与社会学刊》与台湾地区的《新闻学研究》也可以做拔高之用。


此外,一些高质量的跨学科期刊,尤其是社会学和高质量的学报,也可以培养新闻传播学的学科思维。例如《社会学研究》、《中国青年研究》、《北京大学学报》、《南京大学学报》等。


英语不错的同学,可以阅读以下SSCI期刊:


Journal of Computer-Mediated Communication

Communication Research

Journal of Communication

New Media & Society

Information,Communication & Society


细分领域的期刊推荐:


新闻研究:Digital Journalism

健康传播:Health Communication

政治传播:Political Communication

广告研究:Journal of Advertising

社交媒体:Social Media + Society

性别研究:Feminist Media Studies


重点二:跟踪新闻与传播学研究的领军学者


领军人物的研究方向代表发展主流。


根据我自己的经验,如何确定研究方向的领军人物?


第一,可以在中英文论文库检索本领域的关键词,根据搜索到的论文内容,查看相关论文的引用量,一般引用量高的论文作者,可以确定为领军学者。


第二,前期的论文阅读可以选择知名度与公信力较高的学者,例如网络传播研究领域的彭兰老师,新技术研究领域的喻国明、陈昌凤老师,数字新闻学研究领域的常江老师等。


02.

论文阅读的两个层次


论文的阅读层次分为精读与泛读,小董老师用一个非常生动的类比,解释了精读与泛读。


一篇经验研究的基本结构就像一部好莱坞大片。标题、摘要、关键词就像影片的简介,类似我们在影评网站上看到的影片介绍。


而导言与文献综述部分就是对电影故事背景的介绍,例如王子和公主过着幸福的日子,突然发生了变化。这个变化就是接下来论文讨论的重点。


研究方法就像王子踏上了拯救公主的旅程,具体使用什么方法对问题进行研究,经过了什么样的推理过程,最终完成了结论的推导。


我们在泛读过程中,重点关注论文的标题、摘要与关键词。而精读的过程就是仔细阅读摘要、研究方法、研究结论的过程。


在初期进行论文阅读中,不要追求速度。要在阅读中培养自己理解论文主旨内容的能力。


一般来说,阅读论文的时间分配如下:


泛读(<10min):摘要、导言、结论

精读(about 1 hr):摘要、结论、文献综述、讨论

模仿(>1hr):一个字一个字的读


03.

康奈尔笔记法?


阅读过后,要通过笔记或者框架的形式完成论文的消化,小董老师推荐了康奈尔笔记法。


康奈尔笔记系统是沃尔特·鲍克等人发明的,旨在为帮助学生有效地做笔记。康奈尔笔记系统把一页纸分成了三部分:左边四分之一左右(线索栏)和下方五分之一左右的空间(总结)和右上最大的空间(草稿),就像下面这张图这样:



04.

一些补充:思维导图


除了小董老师的建议外,在前期的论文阅读中,思维导图也是一个能够帮助大家整理论文理解逻辑的好方法。


Xmind、幕布、百度脑图、持续进程、思维经理等都是不错的思维导图制作软件。


很多人之所以对思维导图望而却步,是觉得自己不会画画,没办法画出很美的中心图像,如果是因为这个而放弃画思维导图实在太可惜。


中心图像只要字稍微大一些,有明显标识就好,不需要漂亮的“画”,最重要的是自己看的明白。如果你本身就有绘画功底那则是最好不过的啦,如果没有绘画功底,也并不影响绘制思维导图。


此外,思维导图制作中可以遵循五颜六色原则。


大脑会受到色彩的刺激,建议思维导图挑选自己喜欢的颜色或亮色,能享受色彩游戏的乐趣,因为有了颜色的存在,往往在画思维导图的时候就是一种享受。


在这里推荐大家使用行动派最新出品的“PURE彩虹笔”,这款彩虹笔不仅颜值高,获得了德国红点设计奖,最重要的是,它书写顺滑,轻轻延展就可以画出性感漂亮的曲线,简直就是为思维导图量身打造的一款笔,让你在画图的过程中,体会书写的畅快!


很多小伙伴在画这种思维导图的时候,会遇到一个问题。就是在写二级分支的时候,会觉得无从下手。


这个时候,你可以准备一张草稿纸,在旁边写下你认为比较重要的关键词,然后根据知识体系串联起分支的逻辑,有所取舍之后,再决定二级分支应该怎么写,放在哪个位置。


层次化的规则可以分为“分层”和“排序”,先把能想到的都想出来,再进行分类,在思考创意的同时,自然就按层次对他们进行排列。


在真经的彭兰老师全年论文阅读会中,不少小伙伴都制作了很高质量的思维导图。




07.


在初期的论文阅读中,大家最大的焦虑其实还是读不懂。


如果不懂的地方不多,建议大家做个记录,留待以后查阅。但如果它导致整个阅读变得吃力,更高效的办法就是去阅读一篇相关的综述,或者是教材的相关章节,这样就获得了必要的背景知识以继续阅读论文。


阅读中会遇到只被用于某些专业小分支的缩略语和术语,除非它们真的和新传理论有密切的关系,就不用去深究这些细节。


以我自己的经验为例,我喜欢直接在电子设备上阅读,这样就可以轻松地把不懂的东西“复制粘贴”到浏览器中搜索。也算是一个虽然偷懒但很高效的阅读方法吧。

来源:新传考研真经

Mooncake论文阅读笔记


最近昇腾提供的大EP PD分离推理解决方案非常火,很多开发者都开始使用了。正好这两天也看了一篇PD分离的经典论文,就是Kimi采用的PD分离架构:Mooncake。

背景

传统的大模型推理方式存在一个问题,就是一个batch内的所有请求输出长度很可能不同,导致有的输入已经完成推理了,但是必须要等最后一个请求完成推理后,这个batch推理才算完成,才会进行下一个batch的计算,这就造成了计算资源浪费。为了解决这个问题,就有了continus batching特性,当一个batch内的某个请求完成推理后,就立即把下一个请求提上来补上,这样就能使得宽度为batch-size的“管道”中持续有请求在推理。但是这样又引入了新的问题:新请求的全量计算和旧请求的增量计算放在一起计算的时候,由于全量计算的输入token远大于增量推理的输入token(一般为1),所以在组batch的时候会形成空泡,造成计算资源浪费。

于是,PD分离被提出来了。P指的是prefill,即首token推理,D指的是decode,即增量推理;分离指的是prefill计算和decode计算放在不同的计算资源上进行,而不是在相同的芯片上,P算完了D接着算。干湿分离,最大的好处就是让prefill计算和decode计算互不干扰,解决P和D的根本矛盾:P是计算密集型的行为,而D是存储密集型的行为。当然,PD分离也会带来一个问题,就是P产生的kvcache需要通过网络传输到D节点,这个过程需要跨卡甚至跨机!

MoonCake架构

上图是MoonCake的架构图,非常形象,一盒月饼。上面2块是prefill节点,下面2块是decode节点。当然,正式系统不一定是2/2的配置,还可能是其他数量的配置,不同数量配比对应的性能也不同。每块“月饼”的灰色部分是GPU和显存,黄色部分是CPU和内存、硬盘存储,“月饼”之间通过RDMA(Remote Direct Memory Access)传输。左侧是调度系统,主要负责给新来的请求选择合适的P节点和D节点。右侧是P节点和D节点的优化目标。

对于P节点来说,目标是最大化cache reuse,P节点会使用prefix cache特性,简单来说就是用新请求的输入去匹配旧请求的输入,如果能匹配上,就用之前请求算出来的kvcache,避免重复计算。如果cache reuse越高,就越能减少计算量、提升效率。当然,P节点的限制包含TTFT(time to first token)、最低MFU(Model FLOPs Utilization)以及内存限制。对于D节点来说,目标是优化吞吐量,也就是每秒能处理的请求个数。限制是TBT(time between tokens)和显存限制。

需要注意的是,整个架构的kvcache transfer engine是一个distributed kvcache pool,也就是各个节点的内存池信息是互通的,有助于kvcache的共享传输。

当然,对于我们在背景中提到的网络传输问题,论文也给出了答案,认为只要这个公式满足,kvcache的传输成本就不会成为阻碍:B/G > 2ds/。其中B是kvcache的传输带宽,G是芯片算力,d代表模型的隐藏层维度,a、b、s是常量,p是序列长度,gqa是q头数量除以kv头数量。根据这个公式,d越大,所需带宽越小,并且论文通过实验证明,只有B达到100 Gbps,就有正收益。

调度算法

上图是PD分离推理系统处理推理请求的调度算法。

算法输入:P节点实例池、D节点实例池、请求R、cache block size(在这里不用关注)

算法输出:选择的P实例和D实例。

算法思路是先选择P节点,把所有P节点遍历一遍,预估选择每个P节点计算的总耗时,耗时包括3个部分:kvcache传输时间、任务排队时间、做计算的时间。选择耗时最短的P节点作为输出,再根据负载情况选择D节点。

算法详细步骤如下:

step1:计算请求R的prefix hash值,然后根据每个P节点的prefix hash池信息,找到一个前缀匹配最优的节点,记为“best instance”,对应的prefix匹配长度记为”best len";

step2:遍历每个P节点,假设在该节点的prefix_len和best_len满足这个关系:best_len/prefix_len>
kvcache_balancing_threshold,说明这个节点的prefix_len太短了,重新做prefix计算的成本会比从最佳节点拷贝kvcache过来的成本高,所以在这种情况下,需要估算T_transfer;如果prefix_len长度还可以,不满足best_len/prefix_len>
kvcache_balancing_threshold,那么就不需要从最佳节点拷贝kvcache过来,直接在这个节点进行计算即可,这种情况T_transfer=0;

step3:使用经验模型估算每个P节点的排队时间和prefill计算时间;

step4:计算每个节点的总耗时,在遍历过程中,如果发现更短的总耗时,就更新TTFT和实例;

step5:完成P节点遍历,选择TTFT最短的P实例,根据负载情况选择D节点。

step6:如果TTFT或者TBT不满足SLO,拒绝请求;

step7:进行kvcache拷贝传输。

整个算法过程非常简单,但论文中也说了,真正难的、在工程上有挑战的是经验模型
EstimateKVCacheTransferTime、EstimatePreffllQueueTime和
EstimatePreffllExecutionTime的构建。

实验结果

来看一下论文的几组实验结论:

1,和vllm框架相比,PD分离框架的TPOT更短;

2,和vllm框架相比,PD分离框架的TTFT更短、prefix cache命中率更高;

3,P和D节点数量配比会影响PD系统的吞吐。

详细的内容可以参考论文。

热门标签

相关文档

文章说明

本站部分资源搜集整理于互联网或者网友提供,仅供学习与交流使用,如果不小心侵犯到你的权益,请及时联系我们删除该资源。

一键复制全文
下载