【东山随笔#2】
【东山月光下】主要还是会发文献分享,只是有时整理一下平常的思考。
个人浅写一些日常想法,可能未经严谨考虑,见笑于大方之家,还请轻喷。
谈谈科研公众号和自媒体
之前主要在B站搬运外网的大学课程和科研讲座,因为当时是本科生,确有需要了解整个领域。随着研究的深入,现在视频已经无法提供太新的信息了,就很少更新了。到两万多粉丝可能主要还是生物类基础课程的贡献,尤其是医学类课程的播放量断档式领先。但这不是我想要的,计算生物和分子模拟的同行寥寥无几。

现在的公众号是我给自己写的读书笔记。现在觉得JCIM上的文章有很多都和我们做的东西相关,所以几乎盯着它了。
所以,切忌为了自媒体行业追求的指标而付出太多时间,改变某些原则。这些文章都是我了解内容后的副产品,获取到我需要的所有信息后还需要十多分钟编辑好发出来,顺便分享给大家。绝不能像大四弄B站一样天天盯着账号的数据分析来盘算策略,因为真正用来赚钱的自媒体肯定不会弄科研主题,那些手段也都要浪费大量精力。
读文章之前大多是带着问题来的。如果不是要调研某个领域(初入此门)、学习某个特定技术,浏览这篇文章都会快速定位到自己预设的核心关注点上,精确的获取到相关的资讯。90%的文章都只需要大略了解做了什么东西,这便是公众号的主要功能,帮助收集和推送信息。如果某篇文章需要全程精读,一定是和自己的某个project极度相关,比如你要超越的竞品,或实验合作组的前置论文,现在project的基础。如果做方法流程,看到多篇极度相关的文章,表明这个问题大概已经被很多人做过了,不会那么有新意了,除非成功率还在60~70%这种,就别做一模一样的东西了,去找个蓝海吧。
所以各位看官,若有缘就共度这段旅程,若无缘就随风而去。
谈谈AI4S(一)
绝不能迎合AI领域过分optimistic的文风,天天都是颠覆、突破、炸裂(虽然吧,AI不调prompt写出来的东西普遍都是optimistic)。微信的推荐算法也没法完全过滤掉所有胡说八道的公众号呀!而且不知道哪里来的朋友看的比较多的也会推给我。比如看到这种我真是想揍作者,你还自己调了语气呢:
在当今科技飞速发展的时代,人工智能正以前所未有的速度渗透到各个领域,科研领域也不例外。2025年8月20日,浙江大学团队在《Nature Computational Science》上发表了一项震撼学界的研究成果,他们开发的xxx(我不针对研究成果,只针对自媒体),一个由知识图谱驱动的大模型智能体系统,犹如一颗重磅炸弹,为人工智能驱动的科学研究开辟了全新的道路。
天天炸裂,你家都被炸得稀巴烂了!当然,我觉得有价值的AI应用也会好好看并发一篇。要理性判断,而拒绝虚假宣传、洗脑、把观点强加给别人。这也是”媒体”的弊病,吸引人眼球嘛。反正我现在不care。
只能说AI在每个具体领域都是重要的算法突破,但看到太多了总是会烦。我不是专业的,但据专业的人说水文章早已泛滥了。在我专业的领域,我只知道很多问题早就是数据不够成为限制实际应用的主要因素,绝不是数字游戏,所以劝退一切不生产数据集、不做实验的CS专业的人。CS专业的人更应该意识到,现在的有限数据不足以支撑这个模型在广泛的体系上应用;包括很多子科学问题上,人类对其的了解不足以建立正确的模型,如果自己还不测数据那就是扯淡了。也许那些堆积大量数据来做general事情可能还有点用,整合人类所有知识嘛,但这个基本也做的差不多了。所以我觉得4S的风口不会太久。以后应该把大部分Engineering的事情让企业去做,他们还更有钱,大家直接找工作,别来卷学历了,这些东西门槛也不太高。
Engineering也挺好的,主要是得真的推向实际应用,但我只看到算法满天飞。比如蛋白质设计真的很有用,合成生物学也很火,可以有产业的。很多人在水文章,都去做AI污染了科研生态,现在再也不看蛋白质设计的文章了,除非我将来找到一个好课题真的需要设计一个。Engineering就需要考虑更复杂、更实际的系统了,需要多目标优化,且经历实践检验,所以不好水。如酶工程,真的有更好的活性是很难的,催化新反应更难,MD模拟很难做,所以那几个诺奖在搞定向进化+AI,挺好的。binder还是容易些,找到靶点随便就能生成一堆,但biology搞不清楚,真应该抑制这个靶点吗,会有效吗?当然有binder设计工具还是挺好的。设计自组装纳米材料也很有用,背后的热力学什么的更复杂一些,做MD会很有意思。话说回来,如果真要搞蛋白质设计算法,建议针对特定没被做烂的体系和问题。要么没人抢(还能利用丰富的工具),要么你对这个体系有insights(或大量学习后有了),或是需要结合其他领域的知识技术,还是要敏锐地找到好问题。比如我有一个想法,估计是暂时不会被人抢的[坏笑]。
真正的大佬会拒绝无脑做AI。AI模型的黑盒属性导致其无法直接用于传统Science的体系(我理解是,了解某个东西的某些性质,总结出普适的规律),更适合做Engineering(做出对现实有用的东西,预测,生成)。所以说大部分AI应用做的都不是Science,是Engineering,当然我们组做的很多也是Engineering而已。一个AI模型的价值在于:要么就是数据挖掘,生信这种大数据,常规方法分析不了,你能挖到科学的insights;要么是某一步用简单理论和流程解决不了的问题你能拟合出来或有效采样。AI4S或Engineering反倒不是谁都能做,而是在一个领域经验丰富的人知道痛点在哪并用AI很好地解决,比如Baker,侯老师。反正在我们组大家第一个课题大多还是做MD,了解分子结构、互作什么的到底是怎么回事,再去搞数据也是好事。
当然,能水文章也是本事。我还没水出来呢,也不配说人家,哈哈。
去人迹罕至的地方,去视角高远的地方
我的导师说过:”志存高远非常重要,我们的研究目标一定要远大,要努力去解决一个大的科学问题。在某种程度上,解决一个大问题的30%,也比解决一个小问题的70%要好,甚至比你100%解决一个小问题要好。”
这是我给新研究生的建议,要扎实地去了解背景,提出正确的科学问题,同时以1~2个小课题为媒介学习具体技术。
当然,不是谁都做得到的,我就有点难了。也有部分原因是没有人引导我走到一个大问题上,都是自己探索的。所以,取巧的办法一种是蹭热点快速发表,一种是做冷门的方向,这样都不会被人抢发。达则兼济天下,穷则独善其身。

记八月十七日宝石山观日出 几个小兄弟打完麻将打牌,酒入喉,一时兴起少年游。 断桥拂晓人如流,宝石披霞月似钩。 百尺巉岩竞登攀,眼底收。 绿树掩映万里城,西湖如明眸。 日下万物镀金辉,树木葱茏见不得。 忽闻人群唱祖国,原来身在更高处。 友谓更上一层楼,我言山高仍不够。 保俶古塔立千年,和我们在一个平台高度 因为朝向东边,就挡住了,向阳花木易为春 如果我们的立足点远高于现在,自然随便看到日出 却看众人挤桥头,无缘见到吾等见到的景色,却还要挤 少年自应志宇宙,微调内卷不可求。 科研当立群山头,突破创新信手有。

对IQB之出师表
请原谅我前几天彻底黑化,输出了很多负面情绪。作为补偿,在此完整阐述一些建设性意见。
直到整理完这些文字,才发现杨老师和施弟早就想到这些了,或许我正式在他们的启发下才有了这些想法,或者说整理了大家的观点。所以在此分享给所有人。
本课题组的现状就是一团散沙,各做各的。基本上就是6个课题组共处一室,有一些合作课题而已。如果没有人做出巨大牺牲,是永远不可能形成合力的。而其中人数最多的一个小组,除了都会做FEP就没什么关系,其中又各有各的方向,还是多个方向。小课题组也不是不能有产出,但也没有合力,且人均资源和单独的小课题组也相当,那这么算出文章的速率和其他组也差不多。但如果形成合力,则有助于功能模块共享、对科学问题的分工挖掘,局面可能大有不同,是我没体验过的那种。我想这已经是不可能发生的事情了。
本课题组也算追随科学前沿了,AI就是最热门的方向,比相分离、合成生物学什么的热门多了。但是没赶上这一波风口,为什么?一是动作不够快,没占着坑,2025年等大家把坑全都占了,纯粹的AI4S的简单应用人头攒动,毫无吸引力可言,只暴露出数据依赖和可解释性差的致命弱点。只能是在具体的小体系上捡拾剩余的萝卜(当然AI推产业才慢慢开始)。为什么动作不够快?也许是缺乏专业计算机人的指导,但主要就是没有成功make it。二是没有深挖出来物理或算法,逐渐脱离物理学院。之前的纳米生物相互作用,至少自成体系。既然不打算做biology湿实验的课题,也没有靠谱的合作,抗原肽体系本就应该适可而止,证明了一定的可行性就行了,当做一个常规的机制解释方式,因为众所周知其最终还是逃不掉复杂的biology。更不用说binder设计的工具早已层出不穷,而且这些都是给实验组用的工具,目的就是一击即中,一个计算组不搞算法光使用,甚至针对复杂问题的流程都不搞,那读硕士就可以了。
现在我的建议是要从长远的眼光来找问题。要么自己挖掘科学问题:这就需要执行者有较强的技术能力和经过训练的科研思想,从一年级开始就已经具备挖科学问题的能力。按照我的性格,就应该直接跳过AI去找下一个前沿了,作为一个还原论者,一定得是做QM级别的,经典力学的限制是明摆着的。大家说得对,要么往大做,要么往小尺度做,打死都不要卷。另一个考虑的点是,AI不能做什么?比如,哪些小领域的、完全新的数据还没生成出来,我赶紧做数据库然后训练,比如大尺度模拟?然后,这些都是只要有数据都能解决的问题,有没有数据解决不了的问题或几十年内都不可能跑出足够数据的问题?比如biology机制,自己的实验组发现的?
- 要有自己的做计算的主方向,比如免疫和蛋白质构象疾病(PCD),要把人集中到主方向上。之前我diss这些主方向,也只是因为做得不够好、方案不够好。只要大部分人做的是自己的主方向,一是能集中力量挖掘科学问题、出成果,已经陈述过。二是这样自然有了很多理由过滤掉大量的合作课题,去粗存精,因为我们没人手没资源了,我们只做个别真的非常有价值的,然后一起申本子,这样就更加能集中方向了。
- 现有的成员要提高战斗力;未来要提高招生质量,要主动出手宣传,目的是招到全浙大最好的学生。一定是需要一些强有力的人来整合各个方向,真正地读文献并给出正确的且相关而不同的科研方向,使团队走上正轨。在执行层面,招聘合适的博后也许是必要的,且他们有更强的整合方向的能力。
我自己也要反思,因为不受限制,所以总想探索自己的方向,而且特别讨厌内卷,一旦有人做类似的就要坚决避开这个方向,仿佛都是敌人;或者自己都承认本子写得欠考虑,还没有做软件靠谱。但实际上问题挖深了完全可以分工解决,但我们并没有挖掘过什么问题。
这些我也只是说说,如果做不到也没办法,我也不懂具体怎么执行。大多数人都做不到,甚至没有能做到这些所需的资源。而且我以后就写软件去了,或许也跟我无关,不再讨论这样的规划。这也是给低年级学生的warning,如果你打算好好做Science,就谨慎考虑自己的选择,趁早开始挖掘科学问题,多和各种人讨论,规避掉现在这些坑。
转眼一个月过去了,杭城寂静不再是晴空万里,时常乌云密布,电闪雷鸣。气温重新回升到33度,仍然免不了每天汗流浃背,臭气熏天。
孤独的诅咒
其实每个人都是一座孤岛,但爱可以成为跨海大桥。
发文章要像环肽一样
发文章和科研是两回事。科学问题可以永远追问下去,一篇文章永远结不了题。一篇文章一般只能解决几个问题,为了结题,都是狗尾续貂,基本自洽即可。能还用貂尾的,能自我闭环而不节外生枝的,可以称之为“漂亮文章”,是谓环肽。
写工具似乎更容易闭环,小课题某种程度上也是。因为框架小,骨架就闭合了。剩下的是不断优化序列(组件)、亲和力(效果),不断小修小补,调整侧链,是谓模块化。再然后就是加linker,连到E3 binder乃至纳米颗粒上,也就是workflow或platform。
随波逐流,浮浮沉沉
别人说,历史是一条长河
断绝与世界的联系并不能获得真正的解脱,但有助于窥见真理 认知失调:越做工具就越要自己认同坐公交,就会越讨厌 science里面整天谈 novelty 、 story什么的,尤其是想不出来的时候更讨厌。
几张照片
九月初去径山寺,忽而阴风大作,灯笼吹落。但暑气尽去,又有闲云飘过。
云无心以出岫,鸟倦飞而知还。

千里青山翠,万亩稻田香。

炉火摇红风自轻,雕梁影动落花声。

医治不死病,佛度有缘人。跨过这道门槛,关关难过关关过。
