纯文科语言学本科,硕士转自然语言处理难吗?

纯文科语言学本科,硕士转自然语言处理难吗?
收藏者
0
被浏览
97

3 个回答

史迪仔Ly LV

发表于 2025-4-9 18:37:01

先说结论:如果是985(c9最好)以上可以,以下大概率不行。(你高中是理科生的相对容易)
我是参加了PKU陈老师的数算(数据结构与算法)慕课,看到课堂实录的作业展示有学生姓名,随手百度查了一下居然有古汉语专业、传媒、心理学等各种非科班专业,作业的代码写的非常漂亮,逻辑条理清晰。感叹了一下北大大佬的数理基础真的扎实。。
同样参加了THU某ml训练营,整个作业提交都是thu的一位建筑学同学和pku一位建筑学同学(卷起来了…)代码写得最好,而且在分享的时候她们都是之前没接触过Python,三个月就把机器学习的实验做得这么好了。这让我想起最开始在慕课蹭清华的青年ai自强讲座的时候,主持人统计很多人都是文科生,但是基本都自学完了Python。

这个学习能力最好的检验方式就是你的第一学历。

baiyuting LV

发表于 2025-4-9 18:49:53

非常难,至少在国外基本不可能。但是如果你的学士论文能展现你NLP的能力并且你在本科中选修了足够的NLP或者ML的课程,是有可能的。单轮文科的语言学,它实质上研究的东西跟NLP完全不是一个东西,所以如果你学士论文写了NLP的东西,那实际上又否定了你自己的专业。所以很矛盾。如果你真想转修NLP,请修第二学位。

Mr·Jax LV

发表于 2025-4-9 19:04:12

难,又不难。
很多学校本科语言学方向,除了和大学语文一样地位的大学数学,基本不学数学,计算机基础知识也就一二级考级知识,编程可能也基本不接触。但自然语言处理方向,如果不是打定主意走学术之路,国内大部分NLP工作,所需知识和技能主要还是数学、编程语言、计算机基础三方面的知识,语言学就是个打辅助;如果要走计算语言学学术之路,语言学知识又变得重要了,它可能变成你立足之本,而其它三个方面,就是你的研究工具。
难的地方就是入门的时候对于要补充的数学、计算机知识、编程语言,完全没有方向、没有方法、没有概念,而偏偏这些知识的难度对纯文科的学生来说不低。如果没有好的引导,很容易导致你像盲人摸象一样,东摸摸、西碰碰,越摸越糊涂,越怀疑自己,要不了一学期,你就从入门到放弃了。
不难的地方,是这个方向优秀的、开源的学习资源非常丰富,一旦入门,你找准主线,扎进去,以项目为主导,边学边用,边练边学,完成一两个项目,你基本就入门了,比如完成一个文本分类任务,完成一个句法分析任务;而这两个任务无论是语料、开源代码、算法讲解的资源真的非常非常多,你耐心花两三个月去啃下来,你就基本上算真正入门了。
真正入门后,又变难了。如果你要与与那些科班出身的聪明人相比,你的数学推导能力、代码能力往往显得比较low。看NLP相关的paper速度很慢,还经常搞不懂要求教于人;对于不能复现的实验,你很犹豫到底是自己太水,还是paper的问题,亦即你定位实验问题的能力不如人。
所以,总体而言语言学本科要转自然语言处理,首先解决初入门的问题,再解决真正入门后的问题。
对于前者,我的建议是耐心花个三四个月时间,把高数、python、算法和数据结构啃完。啃高数不是要我们像学考研数学一样,要去刷分。而是,先理解个大概,能做基础题了,就看下一章,遇到之前的知识不会了,再倒回去看一下,就像100分的要求,你对自己5-60分的要求,就够了。至于编程语言,首选python,先找个15节课内能把基础讲完的课看看,跟着写写代码;如果有点基础,直接翻翻菜鸟教程,不懂的地方谷歌或搜狗一下,基本上你这个阶段的问题都能得到解答。至于计算机基础主要就是算法和数据结构,python基础入门了,就可以找本数据结构的书来看着练习了,数据结构的书很多,而且大部分用C++来写,对初学者不太友好,可以找一本用python写的,比如清华大学那本数据结构的pyhon版。当然这三四个月期间,还是要翻一翻计算机导论之类的经典书,当娱乐吧,有助于你理解编程。做完这些,好了,你初入门了,可以开始去啃硬骨头了。
有一点基础后,赶紧找个项目来学习,没有什么比任务导向学习更快速掌握实用知识、把握方向的。这个时候要警惕一点,很多语言学专业转行NLP的研究生容易被导师有意或无意地利用,让你去搞语言资源相关的工作,就是当实验室外出觅食的小蜜蜂与小蚂蚁。一方面导师可能自身没有能力指导你语言学研究,那么让你去搞这个方向,你一个硕士很难挑起重任,意味着你学术前景可能暗淡;另一方面,他给你的工作耗时费力、技能要求低,不利于你学习,意味着你工业界的职业前景不妙。对于这种情况要坚决拒绝,明确自己的目标就是来学习自然语言处理的,资源建设可以参与,但主要方向还是要做偏计算的项目。如果老师给不了你项目,自己去网上找项目来练手,很多的。
至于真正入门后面临的困境,我就没建议和看法了,可能需要倒回去重新巩固一下数学基础知识吧,但我已经是条咸鱼,实在没精力与时间去系统地修炼内功了,只能是遇到问题慢慢扣了。但总体而言,我还是觉得语言学专业知识可能才是我们的强项吧,最好不要丢了,或者矮化了,自然语言处理相关的知识与技能,只能说是给我们提供了研究工具,以及跨学科思考问题的能力。

您需要登录后才可以回帖 登录 | 立即注册