【长文】24.8~京都大学数据科学/东京大学情报理工CS/东京大学复杂理工~合格经验

一、背景

笔者参加并合格了2024年8月京都大学数据科学、东京大学情报理工cs以及东京大学新领域复杂理工的夏入(2025入学)。

我的背景比较不具备参考价值,有点奇怪。

学校:非科班并且工作后辞职备考。

本科GPA:3.5/4

英语:托福97

日语:略强于50音。未提交任何日语成绩。

以及先套个甲,修考非常的小马过河,很难说别人的经验就完全适应于你;以及修考的很多流程确实是黑箱,本文中的内容很多都是推测。所以本文内容仅供参考,不构成任何投资建议,啊不,决策建议。

本文参考了很多大佬的经验贴,在这里着重推荐以下几个:

焦糖布丁:京都大学数据科学2023夏入合格经验

知乎上京大DS夏入的经验贴似乎只有这一个,特别感谢这个帖子让我少走了很多弯路。以及同样推荐帖子中提到的霓虹爷写的网站,简直是京大知能修考必备。

一滴:2022年度|京都大学知能情报|东京工业大学情报工学|大阪大学情报工学|合格经验谈

这个帖子我最经常看的是对于合格几成能入的分析,我觉得这位佬的分析很有道理。

takaou:东京大学cs/京都大学知能情报/东京大学复杂理工23.8合格经验谈

takaou佬的经验贴我读了无数次,某种程度上也是参考takaou佬决定了如何出愿。

mmRose:2023.8东京大学情报理工创情合格经验|商科跨考生视角准备cs专业课

佬的专业课如何准备写的非常详细,对我帮助很大。

二、动机

想放弃原有生活的起因是过得不开心:工作内容无聊、压力大、加班多,并且个人对行业未来发展和个人薪资待遇趋势极度悲观。不过,对于这些问题有很多种解决或者说面对的方法,我个人选择了一条比较极端的路——裸辞润日学AI。

之所以做出这个选择,涉及很多个人方面的偏好和对未来生活趋势的判断和期望,跟本文主题没有直接关系就不提了。我只想强调这完全是我个人的选择,不具备任何参考意义,或者从一般人的角度讲可能比原地苟着什么都不做会更差,甚至你也可以直接认为作为一个老二次元,我只是想去日本玩几年并且逃避工作。这么理解我的做法,我也完全可以接受。

三、专业选择:为什么cs?又为什么ai?

根据我搜集的信息,可以明确的是,如果你只是想在日本读个书然后留下找工作,那么你完全不必卷情报,情报系也完全不必管他是cs还是别的什么,也完全不必卷东京工阪等。这样如果一心想润的话,其实日本的难度确实不高。以及我个人是打算读博士的(同样只是出于个人偏好和判断),来日本的一个因素就是通过修考你可以在毫无相关背景的情况下进入能稳定发ai顶会的组,并且读博的竞争相对小一些;与之形成鲜明对比的是,你想在其他国家/地区读ai相关phd甚至master,都有大把的本科发顶会的人跟你竞争。

但对于只是想润日找工的同学来说,读博很可能是个减分项。

那为什么我选cs呢?首先我个人对cs很感兴趣,本科时选过算法分析设计和数据结构两门课,也瞎看过一些操作系统、计算机网络的教科书(只是看看,所以对后续学习其实没有帮助,早忘光了),读硕前曾纠结过转金融还是转cs(没想到最后还是绕回来了)。

其次是我现在看来,对我来说cs有以下几个别的学科无法替代的优点:(1)工作技能基本上可以认为全球通用,通用性我认为似乎只有蓝领职业技能可以媲美(此处是褒义,如果我有美国身份,我并不介意选择开卡车或者别的体力活作为职业);(2)工作方便remote,remote一个浅层的好处是不用坐班,当过几年社畜的我对此深恶痛绝,一个深层、可能不太容易实现的好处是可以赚美刀花日元/RMB,这样的生活品质我个人认为是相当高的;(3)薪资相对高一些。当然我不是期望说一定能够实现、利用这些优点。

为什么ai方向?一也是个人兴趣,事实上我是从alphago横空出世的时候就对ai很感兴趣,甚至当时跟本校别的学院做ml的老师套了套磁看有没有机会进组混一混,不过因为种种原因放弃了,2023年以来chatgpt、sora、FSD12以及在其他行业的应用等ai各方面的成果和局限让我越来越感兴趣。二是个人背景在cs相关方向里跟ml比较搭。三是我个人对ai的前景非常看好,愿意将自己的精力投入到相关学术和行业的发展中,当然ai前景好并不意味着读ai相关博士前景就好,尤其是读完毕业都四五年之后了,何况ai前景也是未知的(本文发出前夜英伟达暴跌10个点)…不过我愿意试一试赌一赌。

Ps: 我个人还有个不成熟的想法,我觉得machine learning system和physical ai这两个领域很有前景,或许背景相关的同学可以考虑试一试。我个人也考虑过做这方面,但是我没发现日本有做machine learning system相关的组,机器人领域似乎发CoRL的老师也不是很多,而且做机器人相关的老师基本上都不在cs系,修考科目会多力学什么的,那就真是一点也不懂了。

四、择校/择组

择校择组

我择校的时候,是通过airankings,把近年来发过AI领域相关顶会(包括ML、CV、NLP、Robot)等的组都找了出来,然后结合学校、项目决定了报考范围。最后选择了京大数据科学、东大情理CS和东大复杂理工。

京大在知能和数据科学之间我选择了DS,因为知能倍率更高,而2023年DS的倍率超低,我想着这个报录比可以拿京大作为保底的选择,然后主冲东大(当然还有原因是DS无面试,面试还是难免会紧张因此有点抵触)。事实证明市场上有效的,不存在捡漏的情况,报录比DS2024年一下就飙到3.5了。对于报录比波动这点我其实也有过担忧,但觉得一是DS出愿得托福,根据我观察其实很多修考的人是只考托业的,二是DS的老师基本都是算做ML的,而知能其实最热门的是做CV、NLP这些的,鹿岛研似乎并没有西野研和黑桥研卷,所以我觉得选择做ML的人应该不会这么多,两相结合DS的倍率即使上升应该也有限。结果就这么被打脸了。目前来看,京大DS的优点是学部生少,这样即使相同倍率DS的竞争强度理论上也会低一点,但缺点是DS似乎严格按照合格线划分,已经起码出现过两次最后录取的人数比预计招生人数还少的情况了(今年预计招4月生16个,结果10月+4月加起来招12个),而反观京大的其他专攻以及其他学校的项目,都是招人会比预计多的。所以我猜测可能DS的老师毕竟其实都附属于别的专攻,实验室名额是有限的,你考的成绩不满意,老师就不会把留着的名额给DS。

决定报京大后,当时出于我都裸辞润一回了,直接干大的,就决定剩下就冲难度最高的几个项目,情报理工cs和复杂理工安排上。现在看其实这么做很不值得效仿。

一是你永远不知道你的心态会是什么样的,原本我觉得我直接这几年攒的钱足够我自力更生几年了,而且反正也要读博,gap就gap呗,但真到了后期,来自父母的压力、来自对于做题的厌烦,还是会让你有对再来一次的恐惧。所以还是那句话,只是以润为目标的话,别太跟自己过不去。

二是情理cs确实难考,而且过程中很多玄学。首先情理cs有书类,虽然每年筛的人数不确定,但肯定是要筛到最后招人数的1-2倍,你也无法预判当年有多少人出愿,出愿人一多、通过书类的名额给定,你可能就被刷了,并且书类也有一定玄学。过了书类之后,即使你往年过去问做的很好,也没法保证你共通数学就能正常发挥;专业课的随机性更大。当然更关键的是,情理cs对于非学部的外国人来说,报录比可能很高。今年情理cs计划招44人,实际4月生招了44人(10月生2人),通过书类的是81人,最后只淘汰35人左右。但这35人很可能大部分是非学部的外国人,情理cs专业课考试会在考场名单上把外国人考号划横线,因此可知外国人大概占80人的一半左右;但这一半的外国人中,其实很多本身就是在日本一路读上来的学部爷(参见takaou佬的经验贴,和今年cs二面有两个外国人但最后有消息称都是学部爷),所以非学部的外国人即使过了书类,倍率应该也是很惨淡的。多重因素组合下来,我觉得实在没必要死磕情理cs。就算是想做ai学术,其他专攻和项目厉害的导师也很多的。笔者今年能合运气也很重要,导师的lab今年招人似乎蛮多的。

所以如果想在东大做ai研究的话,情理的数理、电情、创情或者知能,其实都可以试试(难度应该小于cs?)。

日本ai什么水平

顺便讨论一个问题:日本的ai到底什么水平?从学术角度讲可以肯定的是不如大陆,整体上也没有什么有影响力的工作。业界就差的更远了。但学术界虽然不如大陆,在世界上水平还是算一流。这个问题其实知乎上有讨论,有大佬认为光论学术的话大概一流末尾水平,参加以下回答。

日本AI技术怎么样?在世界属于哪个Tier?

当然我也只是门外汉,我以下再基于airankings分析一波顺便推荐一些组:

(1)从学校的角度看,如果是直接选2014-2024的话,东大大概在全球18名左右的位置;选到近几年的话,东大大概30左右,其他学校百名开外。似乎也很符合认知,近年来其他国家地区的高校发力明显,日本的资源基本也都集中到了RIKEN、东大,其他学校搞AI的老师人数上还是相对较少。从这个角度讲,东大的ai个人觉得确实算一流末尾水平,而且比起来相同水平的学校,bar明显要低一些,起码给了跨专业的同学进入世界top30的AI PhD Program的机会。

(2)从老师或者组的角度看,其实日本可选的不错的组还不少。我个人简单根据学校列一列(当然一下分析仅仅依靠与airankings,可能有很多偏差):

京大:

1)黑桥lab,NLP方向,知能招生。光看airankings上2019-2024年间,NLP领域Adjusted Publications是10.5,日本top级水平;这个数据在世界上是什么水平呢?相同条件下查询世界排名前三的高校,这个数据在各校内部的水平是:CMU,7/20,THU是6/25,PKU是7/31。可见虽然不是世界强校顶尖大牛水平,但也算是第二梯队。

2)西野lab,CV方向,知能招生。光看airankings上2019-2024年间,CV领域Adjusted Publications是11.2,日本top级水平;这个数据在世界上是什么水平呢?相同条件下查询世界排名前三的高校,这个数据在各校内部的水平是:PKU,12/69,THU是9/50,Chinese Academy of Sciences是10/33(没错前三都是国内院校,而且活跃学者数明显高于NLP,CV是真卷啊)。同样应该可以算顶级强校第二梯队的组。

3)鹿岛lab,ML方向,知能/DS招生。类似前面按照ML+AI筛出来是9.3,日本一流水平(不过鹿岛研很多文章是发到数据挖掘相关会议上的,这些在airankings上都没计入,虽然现在貌似KDD等会议的地位相比机器学习三大会确实越来越低,但如果对这个方向感兴趣的话,鹿岛研无疑综合来看也是日本top水平,google scholar上2019年至今的H-index35,在日本学者里算很不错的了,2024年还中了几篇CVPR)。这个数据在世界上是什么水平呢?相同条件下查询世界排名前三的高校,这个数据在各校内部的水平是:PKU,25/126,CMU是22/81,THU是24/85。相比之下,ML领域在顶级强校可能就排不太上号了,中游水平,但从活跃学者的人数上也可以看出,ML领域竞争是很激烈的,这样相对而言也是很高的水准了。

4)下平lab,ML方向,系统/DS招生。类似前面按照ML+AI筛出来是2.4,可能是下平老师属于偏老派一些的统计学者(没有深入了解,大概印象)所以在AI相关顶会上投的不多(不过23年一口气发了三篇EMNLP,似乎是表示学习相关的,我也不太懂,今年又挂了几篇在arxiv上,估计也能发顶会,水平是很高的)。需要指出的是,下平研近年来加入了一位Junya Honda老师(原来好像是杉山组的,airankings也还算在东大下面),同样情况下筛出来的数据是9.3,而且似乎处于上升期的样子,2024年中了很多篇COLT。所以整体来看(包括考虑AI方向其他领域的顶会顶刊),下平lab的产出也是相当不错的,在日本同样属于一流水平。

另外,通过airankings还能搜到一位yamada老师,ML方向的,数据是13.6,不过这位老师似乎已经离开京大了。还有一位Nobuhara老师,CV方向的,数据也不错,但人也不在京大了。

综上可见,京大还是有几个相当不错的lab的,如果没有修考的途径,不论是在国内还是国外,很难想象一个本科不是CS且没有接触过ai相关科研的同学能有机会进入这样的lab学习。虽然说对于只想修士毕业就在日本招工的同学来说可能跟其他的lab也没什么区别,但我个人认为如果想在AI相关领域科研上有所作为但苦于之前背景不相关的同学,通过修考进入这样的lab学习是非常值得的投资(注意只是个人看法,毕竟我也只是个门外汉)。

东大:

杉山lab,包括两位小导师,情理CS/新领域复杂理工招生:这个就不用细说了,ML领域的影响力很大,最近应该还当上了CV领域顶刊TPAMI的Associate Editor-in-Chief,同时是ML领域三大会2024年的Senior Area Chair。足以证明水平之高。

铃木lab,情理数理情报招生;应该算是杉山之后日本ML的领军人数,似乎主要是做用数学解释分析深度学习的,发ICML、ICLR如喝水,感觉还属于上升期未来的成就会很高,非常适合数学好的人报考,不过据说主要是招学部爷?反正知乎上没看到过直接录到铃木研的。

佐藤lab(issei sato),情理cs招生:原本应该是杉山研的,最近几年独立出来了,每年稳定数篇ML三大会。

宫尾lab,情理cs招生:情理热门,似乎老师在日本的影响力很大。

相泽lab,情理cs招生:似乎其实是属于nii的,但在情理招生,每年产出NLP顶会。

佐藤lab(imari sato),情理cs招生:CV方向和医学影像处理,也是属于nii的,airankings上没有收录有关信息,但csrankings上可以查到(数据很不错),看组里每年也是稳定产出CV顶会和TPAMI,以及很多医学影像方面的顶会。

谷中lab,情理cs招生。NLP方向,有NLP顶会产出。曾在知乎上看到有人说选了她做第一志愿。

原田lab,情理电情招生(可能不准确;据佬反馈应该同时在情理和工学院招生):CV和机器人方向产出很多,同样也有种发顶会如喝水的感觉。光从发表上来看似乎是日本CV第一研?而且个人觉得CV+机器人前景很好。

佐藤lab(yochi sato),似乎是在情理电情和情报学环招生(可能不准确):CV方向,稳定产出CV三大会。不过之前有在知乎上看到有人说老师对学生背景要求蛮高的。

中山lab(Hideki Nakayama),似乎是在创情招生(可能不准确):CV和NLP方向都做,或许应该称之为多模态?组里产出也很不错ECCV、CVPR、WACV2024年都中了。EMNLP、ACL什么的以前也有发。

因为airankings还包括机器人领域的,所以东大还有不少做机器人的老师数据也不错,不过不太熟悉他们的研究领域就不多谈了。顺便再推荐知乎上一个回答,可见上述列出的实验室其实都是很不错的,如果想进组读博的话基本上都需要强发表加强connection,再次说明了如果你非常坚定的想在AI学术上有所作为,偏偏自身背景弱了,修考进组成功了的话性价比应该很高。

211申请东大人工智能是否可能?

大阪大学

阪大没怎么细研究过,只重点推荐一位老师吧。Yasuyuki Matsushita松下研,IJCV的Editor-in-Chief,稳定产出CV三大会。

阪大还有很多很强的老师,有兴趣去阪大的同学可以细细研究一下。

闲着没事的同学可以自己刷一刷csrangkings和airankings,可能会有意外收获。

五、备考经验

数学课

其实我的数学备考经验不具备参考价值,本科学过高代数分概率论数理统计,但也很久没学了,整个备考过程似乎更多的是回忆和练习做题的手感。就单纯列一列推荐的书吧。

1. 线性代数。考东大情理的话强推斋藤正彦的《线性代数入门》,考点和风格完美符合,有中文版。应该还有一个附带的练习册的,不过练习册应该没中文版。我犯的一个错误就是因为习题没有答案就只看了看内容….如果日语好的找找对应的练习册好好练练应该很有帮助。看了看这本书之后我就靠刷题复习了,小黄书+东大工历年过去问。

2. 微积分。微积分原本想着先找本考研书再速成一遍,但发现看小黄书也不是看不懂。就依靠小黄书完成了一轮的复习。之后又做了演习-微分积分,我觉得这本书不错,把知识点分类列出来专门训练(特别是有针对体积、面积计算的专门训练)。不过这本书里涉及的很多特殊积分似乎不是京大东大的考试风格,特别是东大情理,其实几乎不考奇奇怪怪的积分,他的难度是另一种难度。

3. 概率论。概率论我也主要靠小黄书复习;之后看了遍弱点克服概率统计,但对这本书没什么特别的印象。之后就是做东大工过去问遇到不懂的知识点再查。对于知能统计学,东大的概率论就单纯是概率论,不涉及统计学;知能的专门科目是统计学,需要在概率论基础上额外掌握假设检验。我没有专门复习假设检验,也是过去问导向+本科积累。但如果要应对今年的知能统计学,深入学习假设检验的知识和具体模型是必须的。

专业课

专业课我是下功夫学了。本科时选修过数据结构和算法分析和设计两门课,也曾听个乐呵的听过CSAPP对应的课程(纯属瞎听)、看过操作系统、计算机网络的书等。不过除了数据结构和算法,也只能算毫无基础。

京大:

京大ds夏入考的题目跟知能一样(不过可选的专业课只有统计、机器学习、信息论和信号处理,本文之后ds可能跟知能混用),冬入跟系统一样。我准备的除了数学(包括统计学)以外的课程是数据结构和算法、信息论和机器学习。对于京大知能的准备有一个神器,强烈推荐这个网站,有08年开始的历年过去问的解答,很详细并有相应的知识点讲解。

academ-aid.com/ist

1. 数据结构与算法

参考书目:算法导论

Discrete Optimization, Thomas Rothvoss, UW, 86页的讲义,网上可以搜到

视频:王道数据结构网课

如果只看所需知识点的话,考京大的其实只要看数据结构网课一般而言就够了,涉及到的KMP算法、二叉树、堆排序、快速排序等等都在王道数据结构网课里。其他的都不是知识性的考点,比较灵活,比如考动态规划、贪婪算法、图论的知识等等,这需要对于算法有一定的理解。对于科班或者本科学过算法课的同学来说应该还好,对于非科班的同学我就不太清楚该怎么建立这样的基础的感觉了,或许可以看看算法导论对应的国外大学的网课,比如mit的。

考情理cs的我也建议先刷刷数据结构网课,再刷刷算法导论。因为历年算法题其实也考过很多次排序(被数据结构网课覆盖);考过近似算法(算法导论);特别的,其实情理共通数学里某几年概率论的模型,是可以在算法导论里随机算法一节找到的(比如招聘问题);甚至情理的数值计算也可以在算法导论上找到对应章节。

同样,情理cs图论的内容也基本被算法导论覆盖,不过重要的可能不是具体算法的流程,而是证明正确性的思想。这一点通过推荐的讲义应该能够得到更好的锻炼。比如看完这个讲义后我对最小生成树的定义和性质印象非常深刻。

2. 机器学习

参考书目:李航 统计学习方法

周志华 机器学习

视频:机器学习白板推导,b站有

机器学习这门课程对于知能来说,历年考的挺重视知识面的,所以我都是以过去问为导向,根据考点,结合过去问解答、书籍和视频学习专门的知识。东大的机器学习似乎对专门性的知识的要求不高,主要是考对机器学习基本原理和矩阵运算的考察(今年知能考察的跟这个风格有点像,偏重于原理一点)。

3. 信息论

参考书目:elements of information theory,很经典的教材了

An introduction to single user information theory

视频:信息论课程-上海交大,b站

信息论,台湾交通大学陈伯宁

信息论本来我考前是花了相当大功夫的,因为我认为机器学习的考察内容的不可控性要大于信息论,结果被啪啪打脸,看了看题目就放弃做了。

在不考虑今年题目的情况下,信息论考察的内容基本都是基础的熵如何计算,什么情况下最大最小;编码理论,包括香农码、法诺码如何构造,即时码是什么,唯一可译码是什么,如何判定等等,无记忆、有记忆的信源编码;熵率相关理论及计算;信道编码理论,特别是信道容量如何计算等,值得注意的是上面提到的上交的信息论课程基本上只讲了无记忆性的信道编码,而知能往年信息论考题中其实有不少考有记忆信道(马尔可夫信道)及其相关的计算的,这些应该需要结合过去问和其他资料额外学习一下。

东大:

东大情理cs考的专业课很多,但这几年每年只随机考四门,近年来的考点大概如下(可能有错漏);

之前的考点可参见这位佬的经验贴。可见考点总归还是有频率上的显著差异的,可以根据自身情况取舍。以下内容中会涉及到我自身的对于考点的分析预测逻辑(似乎惨遭打脸)。

shidalei.github.io/2018

4. 操作系统

参考书目:Operating System Concepts,也即官方推荐的用书,有中文版

视频:王道网课《操作系统》,b站上有免费版

情理cs操作系统历年来主要考察的都是进程调度、内存换页、虚拟内存等,信号量考的相对少一些,不过今年也出题了。教材本身难度不大,过去问难度也基本上属于套书上写的算法/程序就行,今年难度稍高,4问里后2问书上没有直接对应的内容,但理论上讲,理解了书上的相关内容是完全可以做出来的。

5. 计算机组成原理

参考书目:Computer Organization and Design, Fifth Edition The HardwareSoftware Interface,官方推荐用书,有中文版。

CSAPP存储相关章节。

视频:CS4100 Computer Architecture,TingTing Hwang。内容完全涵盖了计组的考试范围,并且有公开的视频、课件、作业及作业答案。

情理cs计组过去问可以说基本上就考pipeline和cache。个人认为刷完CSAPP和上述网课相关习题后,应该足够可以做出来了。不过计组已经从AY2022S连考到现在,着实出乎人意料。

6. 数字电路

参考书目:Digital Design and Computer Architecture: Harris, David, Harris, Sarah,官方推荐用书,有中文版

Fundamentals of Logic Design,有中文版。

视频:ETH Zurich – Digital Design and Computer Architecture,课程教科书跟官方推荐的一样。

ucb eecs151,introduction to digital design and ICs,我个人挺喜欢这个老师sophia shao的,这位老师还有一门机器学习硬件的课程,我觉得挺有意思的,看得我都想去做AI加速器了。

以上两门课程b站均有视频,课程网站可找到历年考试题及参考答案(ucb的这门资料对应的其实是另一个老师的课程,shao当年的课程资料似乎是不对外开放的)

Digital system design ,台湾科技大学 刘一宇,b站有视频,但似乎公开渠道没有对应的习题、试题及答案资料,课程教科书是Fundamentals of Logic Design。

数字电路是我个人觉得最难、最没学明白的一门课程,可能是因为我完全没有相关背景基础。第一次读官方推荐的教材时一愣一愣的,感觉完全没看懂,一个edge trigger都理解了半天,去做过去问更是完全无法下手。值得注意的是,东大历年来考的数字电路相关题目中从没涉及到时序逻辑的时序约束问题,所以别像笔者一样在这个点上纠结好长时间结果发现不考。

后来偶然间我发现一本神书,Fundamentals of Logic Design,我觉得这本书的风格非常贴进于情理cs的考试风格,也就是说情理cs其实主要是考逻辑设计:怎样组合现有的元件实现某种逻辑功能(2016w利用majority构造加法器、乘法器等);怎么在给定元件个数和fan in参数限制的情况下,设计出符合要求的电路(2021w、2022w);怎么设计时序电路对应的状态图、怎么最简化状态图(限定D flip flop个数)、以及怎么给不同的状态编码(2021s1);剩下的考点可能更多是对于各种加法器的理解。以上这样内容,这本书基本都有专门的章节讲解具体做法。

踩过很多坑后,我提供一个不一定有效的学习路径(因为我最后也不确定自己到底学明白了没有):首先把ETH和ucb的课程大概听一遍,然后把官方推荐教材过一遍,再把ETH和ucb课程对应的试题做一遍。这种情况下你应该基本很熟悉简单的组合逻辑、卡诺图的使用以及时序电路有限状态机的状态设计和编码。最后再看Fundamentals of Logic Design和相应习题,重点看NAND门的组合设计、组合逻辑电路如何在级次和门输入之间做权衡以及如何化解有限状态机(事实上形式语言与自动机这门课程也涉及)。

Ps: 我考前又看了一下官方推荐用书,其实很多过去问考的点书上确实涉及了,不过都没怎么展开讲,这一点Fundamentals of Logic Design应该可以弥补一下。

7. 形式语言与自动机(情理cs必考)

参考书目:introduction to automata theory languages and computations,官方推荐用书

Introduction to the Theory of Computation 2013 Sipser

视频:形式语言与自动机(哈工大),b站有视频

对于自动机我其实没什么可说的,因为考场上没发挥好,导致我怀疑自身有没有学好。网上的珠玉也很多了,我就强调三点:(1)情理cs自动机必考,且每年题目的风格是相对稳定的;(2)第二本参考书目的习题风格与过去问风格很接近;(3)某种意义上自动机考的内容也完全是书上的,官方推荐用书的正文部分很多证明思路、方法其实完全可以用来解题。

8. 数值计算

参考书目:Advanced Engineering Mathematics,官方推荐用书,只需看里面涉及数值计算的几章即可

Numerical Linear Algebra, Trefethen

视频:bilibili.com/video/BV11

数值计算这里近年来应该只考了数值线性代数的部分,以前年度似乎考过一点ODE什么的。这个可以选择不专门准备,但我觉得学一学也挺好,因为日本修考线代部分不少内容其实也算数值线性代数里面。我个人这个也准备的一般,没有专门刷题,就是看书、看视频加做过去问。

六、考试经历

首先要强调一定要在考前限时多练习几次(虽然对于做题家们应该已经是常识了),不过我由于很久没体验过考试了犯懒,以及做知能往年过去问时都比较快就没有限时练习过。结果今年实操的时候发现怎么一个个的都做不完,跟练习时完全不一样。

而且上了考场遇见考题,真的就难免感叹还是挺看命的,同一科目同一题目,可能在不同环境下发挥就不一样。毕竟修考一般一门科目涉及的题目数就比较少,也基本都是大题,不像高考或是课程考试那样可能有很多种体型、很多考点一起出现,容错率高。修考的容错率还是比较低的,蛮吃发挥的。而你能看到的修考经验贴,基本都是合了的人的经验之谈,难免会有幸存者偏差。所以只是以找个地方读书找工为目的的话,一定要多报几个。

8月6日 京大DS笔试

上午场是考数学+算法。上来线代就给我当头一棒,做到第一道大题的第三小问就卡住了。其实考的就是Householder矩阵,这个矩阵在上面焦糖布丁佬的经验帖里专门提过的。我考前确实有看过这个矩阵是什么(并且东大情理共通数学AY2023里也涉及过类似形式的一个矩阵),但也仅此而已,并没具体记过有什么性质、该怎么证明。于是就在第(3)、(4)问的求特征值和行列式那里卡了很久,然后看第(5)问也不会。这个时候时间已经超出我预期很久了,于是继续做第二大题,第一问花了点时间做出来了,第二问又卡住了。又只能无奈地跳过开始做微积分(这个时候的做题体验、时间安排已经跟之前练习过去问的时候完全不一样了)。微积分有三道题,第一大题的第一小问考过类似的,很快做出来了,第二问求极限又卡住了,因为时间紧迫没怎么想就又跳过了;第二答题几何背景求积分,中规中矩写下来了,但没时间检查(考前原本计划着像这种容易算错的积分题,起码要检查一遍的,结果后面根本没时间检查…);第三问第一小问同样中规中矩,但第二小问让证明无理数又让我愣住了。只好开始做算法了。

其实到这个时间节点做的是有点崩的,不过当时也只能硬着头皮继续往下做。算法分两个科目,第一科目的第一大题常规的给个背景让计算正确的输出,写出来了可惜没有时间检查(这种也是考前觉得容易犯错误所以计划要多检查检查的,结果都没有时间…)。第二大题难度略高一些,题目背景也比较陌生一些,第(1)、(2)小问应该没什么问题,第(3)小问根据直觉猜了一个答案,但自己没完全验证完毕,就感觉时间不够只能就这样了。

进入到第二科目后总算来了一个相对熟悉的内容,第一道大题二叉树,完答但同样没时间检查,不保证正确率。第二道大题动态规划,第一小问比较常规,但第(2)、(3)小问就不一样了,虽然也很快写出来了但实在不知道对不对,题目中特意提到要能在常数时间内计算(印象是这样),也没时间思考写出来的答案符不符合要求了,纠结一会之后回头做数学了。

线代第一大题剩下的小问其实最后也没完全做出来,但(3)、(4)问根据矩阵的特点猜出来了答案,不完全地证了一下,第(5)问还是没思路只能放了。又在线代第二大题第二小问上磨了磨毫无进展,放了。微积分最后一个小问证无理数,继续懵了一会后,突然想起了东大情理搭梯子的出题风格,于是根据前面小问的结果,按照无理数不能写成两个整数的商的形式的定义,写了一个证明,但也不知道对或错。最后的时间想去算极限,时间到了也没算出来。

中午随便吃了点,想着看来得靠专业课了。开考之后迅速看了看题目,本来是优先选择统计学+信息论的,结果信息论的第二道大题看了一遍连题目都没看懂,果断弃了。决定选统计学+机器学习。但专业课难度也不小,只能心中哀嚎着硬着头皮做。

统计学第一道和第二道大题还算常规,但其实第二道大题的证明也有点瑕疵,因为时间关系没时间细扣了。第三、四道风格跟以前差很远,尽管都是涉及假设检验,但之前统计学考的内容往往是基础的假设检验知识+概率论的应用就可以解决,这两道题就比较专业、涉及专业的结论了。我之前的相关专业知识都忘了,只是在准备考试的过程中通过过去问回忆起了基础,然后觉得足够用了就没再复习,现在看完全过拟合了。于是纠结一会后只能先放过做机器学习。

机器学习也有点难度,并且风格跟之前的也不太一样,之前知能的机器学习可能需要的是比较广的对于各种算法的了解,今年考得就比较理论、重推导了。虽然总算是能做的,但确实花了不少时间。然后再转头做统计学,第三道大题根据题目的意思和背景大概猜到了答案,但推导写的不严谨,统计量的构造也不确定是否正确。第四道大题第一小问硬着头皮写了写,第二小问就只能称之为在蒙了。最后很快时间到了,也没写完只能这样了。

考完复盘的话,整体完成度是比较高,但不确定正确率是多少:线代的证明很难说给多少分,微积分、算法容易算错的地方也根本没时间检查;统计学的第三、四道大题同样很难说给多少分,机器学习最后几问让具体计算的也没有检查。

最后自我估计算上英语的话,总得分在六七成之间,再保守一点的话应该也有五五成以上。按照之前大佬们的经验贴,知能难题年五成应该也能进面。今年的试题根据qq群、小红书的反馈来看,应该是普遍觉得难,这样的话应该还是有希望的。

但不得不说考完等成绩的过程还是很煎熬,感觉自己心态有点崩。之前都觉得自己做好了gap的准备,并且自己攒的钱也足够自己花几年了,觉得gap也无所谓;但真到了这个关头,想到之后可能来自父母的压力、以及可能还得再把自己的时间花很多在备考上,确实很难受。不过还好没有影响睡眠,就是时不时心里都会再验证一遍自己大概能得几成…

考完在关西晃悠了几天,原本还想去宇治等圣地巡礼一下,但天气实在太热了,就也没咋逛坐着新干线去东京了。

8月15日 情理共通数学

情理的考试证明了千万不要琢磨出题规律,琢磨来琢磨去可能会坑你。以及情理共通数学今年的考试流程跟前两年又不太一样,是三道题一起发下来一起做,而不是50分钟做一道、50分钟做一道。

第一道线代,原本想着连续三年都跟几何背景有点关系,今年应该不会了,或者即使还是考几何相关,跟AY2024的风格应该也会有所不同。结果还是考了比较抽象的那种几何背景的题,可能也是我太菜了,这种风格的题都不太会做,第二问应该就卡住了,后续只能连蒙带猜,完答率五成左右。

第二道微积分,考了ODE,但解题中很多内容都在算积分(有可能是我做错了),整体可以说是中规中矩吧(唉,情理共通数学感觉还是微积分比较稳定),完答,但我觉得计算很可能出错了,因为根据我的计算结果做最后一问显得就很奇怪。

第三道概率论,之前本来想着已经连续考了多年的离散了,也该考连续了。结果继续离散考递推,我…..。同时题目上出现了英文in a row,我纠结半天这是什么意思,还翻到日语试题试图用我的五十音功底解读一下,最后还是按自己的理解做了。虽然因为之前毕竟也练习过,通过动态规划的思想写递推,然后解通项公式等等,最后除了最后一问都写出来了,完答率80%以上。然而…..考完看qq群有人发出来其实小黄书上有一道类似的题,我一看心就凉了,纠结别的半天结果递推公式写错了,也是因为时间关系没有细想,所以一定要准备考试期间多限时练几次!!

最后的时间里我在没有写出来的部分修修补补,但也没什么实质性的进展时间就到了。

最后完答率7成多八成,但正答率估计惨不忍睹,可能最多五成……

Ps:情理共通数学的监考非常严格,如果穿的衣服上有字符是真的会让你换的。本来我还奇怪为什么要求必须提前半个小时到场,最后发现不这样的话开考前各种检查流程确实走不完。还有很多别的要求,通过书类后教务发的考试指引最好还是认真的看看。

8月19日 CS专业课

CS专业课再次打脸了我的出题预测。之前我一直觉得应该是自动机+操作系统+算法(非图论)+数字电路,小概率把操作系统换成机器学习/数值计算,因为计组已经连考多年,并且图论刚刚考过,数字电路则蛮久没考了而之前也算重点。结果最后考了自动机+计组+操作系统+图论。同时,专业课的考试安排也有点变化,之前应该是分两次发卷,每个卷子上两道题,今年一次性四道。

第一道自动机其实后半部分sipser似乎有类似的课后题,遗憾的是同样是时间不够了。第一问让根据题目背景写一个正则,第二问让构造一个最小化的DFA,第二问卡了蛮久,选择直接做后面的题了。最后又翻回前面的时候已经没什么时间了,就按照既有套路随便写了写证明,但完全没写完。完答率顶多算2.5成。

第二问计组。虽然我觉得他不会考,但毕竟考前一两个月学过,16-19号间也又看了看,还是有基础的,所以一开始做的时候也有点信心。但第二问他让求的东西,我之前没看过这个名词,琢磨半天才意识到本质上估计还是需要求cache hit ratio。第三问更懵让分析哪个指令格式更省电路资源,随便蒙了一下。勉强算完答。

第三问操作系统。今年的操作系统难度应该大了些,而且比较费时间,他将进程调度和信号量结合起来了。同时给了四个算法、四个小问,每个小问都要把每个算法的指标算一下(经过分析后应该有些已经算出来的值可以直接用在后面的小问)。勉强算完答。

第四问图论。第一问如果我没做错的话,难点其实在于读题、理解题目给了啥条件,理解了之后应该可以根据题目提供给你的算法很快写出来他要求你设计的算法。第二问是个证明题,但我忘了具体证啥了,应该没花太长时间。之后我磕第三问(也是个证明题)磕了很久,有了些思路但写的磕磕绊绊的,没有时间了就赶紧返回去又补了补自动机。完答率算六成?

总的来看专业课完答率大概算七成,正答率乐观估计六成。综合数学、专业课和英语成绩(注意情理cs其实没有给任何分数计算公式)可能整体算六成得分(纯自己随便估计,这点跟京大不同,京大可以查分并且有明确分数计算公式,知能又有合格线上下参加面试的设计,因此京大的合格线似乎可以比较好的估计出来,但情理cs没有这个机制)。也不知道这个算啥水平,但跟2023年的takaou佬和布丁佬的经验贴对照了一下,感觉很可能凉了。心里有些失落,很期盼之后的面试,看能不能进二面名单。

8月20日 复杂笔试

Slot1微积分,我一看题目感觉挺简单的,并且线上考试进入状态比较慢,就做的比较慢,然后突然就发现时间所剩无几…..赶紧加快了速度,但最后还是有个小问没完全做完,完答率9成,正答率不知道多少,因为复杂微积分是直接只写答案的,所以错了可能就直接没分了。

Slot2我选了线代和概率论,因为先前教训的关系这次想努力加快的做题速度,但总觉得直接算的特征向量有点奇怪,反复验算了几次始终感觉有点问题,最后浪费了时间也没得到增益…然后由被线代第二大题卡住了,一开始下意识以为不对称的定义是变成负号,但在这个理解下做题感觉怪怪的,纠结半天后想起变成负号可能是skew的定义,于是重新开始。但第一问还是没有做出来;完成第二问后开始做概率论。概率论整体常规,但第二大题的最后两问似乎有点麻烦,算了半天没算出来母函数到底是多少,没有时间了返回线代。所幸突然想起来之前看过的一个知识点把线代证完了。最后线代完答,概率论大概8到9成,正答率难说多少。

整体笔试完答率9成,正答率难说,可能7成吧。

8月21日 情理cs面试(线上)

主要是19号晚上和20号早上把历年经验贴看了看,总结了一下常见问题,为什么报这个志愿,研究计划写了啥,考得怎么样等等,大概提前准备了些。最后问的问题也大概就是这个范围。需要注意的是一定要一直保持在线!一面面完后部分考生有二面,按照往年的经验,有二面的基本上稳了(今年似乎也是这样)

我对着cs的笔试、面试考场名单和二面名单看了看,进了二面的6个人(不知道为何远少于过去的二面人数,过去有经验贴提到有一年二面有12个人,而今年按理说情理cs还扩招了)是面试时每个考场各挑了2个人,其中四个霓虹爷两个中国人(后来qq群有人说其实都是学部爷)。

8月23日 复杂笔试结果公布

进面了。复杂出愿人数在140人以上(根据公布的书类考号),假设是145人。通过书类的有96人,进面的有64人。今年计划的招生人数跟往年一样是25人,往年招的人大概在40-50人之间,其中外国人大概在10-20人之间(此前基本是10人左右,令和5年是18人)。

8月26日 复杂面试

笔试通过后复杂教务会发邮件告知面试相关安排,每人差不多5、6分钟,问的问题基本也是motivation和小作文。最后复杂4月录了39个,10月应该是6个,合计45个。

9月2日、4日结果公布

还是蛮出乎意料的,居然都合了,现在想想也还是觉得运气很重要。

七、结语

各位大佬的经验贴中已经贴出过很多qq群了,我强烈建议大家加一下。虽然我没怎么在群里发言过,但也会时不时的看一下。我觉得修考群里的氛围还是很好的,有什么疑惑、问题群友都会很热情的交流。我也很希望能够将这种开源的、互相帮助的风气传递下去,所以有什么咨询的问题,欢迎私信。不过应该也能看出来这是小号(马甲可不能掉!)所以虽然最近应该会时不时刷一刷,但几个月后回复可能不会太及时了。也欢迎一起入学的小伙伴们私信我。

最后,知乎和小红书上也有很多大佬发和即将发经验贴了,可以多多关注。

来源:知乎 www.zhihu.com

作者:学成归来李世林

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

0 0 投票数
文章评分
订阅评论
提醒
guest
0 评论
内联反馈
查看所有评论
滚动至顶部