頭上懸著三把劍:
如何逆轉非編碼區基因突變進程?
腺病毒如何通過影響非編碼RNA影響植物?
倒計時2548天。
每當看到著四行字時,盧赫都覺得真的有一個大寶劍虛貼在自己的后腦勺上,好像下一秒就要被破瓢。
頭痛。
不過并不是每一個人都像他一樣痛苦。因為倒計時的盡頭是什么,只有少數人知曉。
事實上,也就是像他一樣的小年輕才會糾結為什么會從13年縮水到7年。混過職場的老油條對此都是見怪不怪的:
拖延癥是打工人的專屬,領導們一般都有強迫癥和妄想癥。因為他們總是恨不得項目一申下來,立刻就給做完。
所以重要的時間節點,一般都會往前定,給出一定的余量與緩沖。對于這種關乎人類存亡的事情,余量6年更是無可厚非。
至于7年的真正緣由誰知道誰不知道,分辨起來也很簡單。
只要搬把椅子坐到門口,翹著二郎腿,心不在焉地掃一眼來人的表情,便可輕易知曉:
剛被奇奇怪怪的早餐摧殘過,神情呆滯地直視一眼橫幅便一股腦往里沖的,大概率是不知道的。
本來腳步輕快,卻在看到橫幅后停頓一下,然后開始皺眉的,大概率是知道的。
雖然這個鑒別同胞的想法在盧赫腦中存在很久了,但他從未真正實踐過。
因為研究的推進比他想象得要快,短短幾天內,基于海晝天基因組的數據集已經建好了,他們可以開始煉丹了。
之所以稱之為煉丹,是因為機器學習模型的訓練過程,受到超參數的影響。
所謂超參數就是人為預先設定的參數,設得好,模型訓練得就快;設得不好,模型可能壓根就不收斂。
至于什么是好,什么是不好,只有全知全能老天爺才能知道。
天心最難揣度。
說到底,除了扎實的基礎和豐富的經驗以外,想要快速訓練出一個能用的模型、煉出一個能不把人吃死的丹藥,運氣最重要。
而煉丹是要時間的,七七四十九天之后,如果這丹藥不能用,那么這時間就被完全浪費掉了。
所以,他跟著那幫專業煉丹的人開了大半天的會,討論了怎樣分配有限的煉丹爐。
雖然他聽不懂那些高深的特征增廣、小樣本學習、時間序列預測、給數據驅動模型添加物理約束等理論。但作為一個通識課上學了9個學時,就被要求一個暑假里手擼一個圖像識別算法的高材生,他有他自己的想法。
他要用強化學習。
“對于強化學習而言,我們的樣本太少了。”哪里都要摻一腳的鄭K一如既往地苦著臉說。
“少就少唄,又不是不能用。再說了,我們不是正在用老鼠造模嗎?造完了樣本就多了。”盧赫不以為然。
“具體思路呢?”鄭K憂心忡忡地問。
“跟你們一樣。特征是某時間點的基因組,標簽是未來的突變位點,然后讓單堿基編輯的載著相應向導RNA的CRISPR系統在那里等著,一旦突變了,就立刻給修復。把病扼殺在搖籃里。
非要說有什么不同,第一,我這是黑箱,只能發揮作用,卻不知道怎么發揮作用;第二,我這基本算是端到端的、全自動的,人工干預只在定期查基因組和設計CRISPR系統,這部分工作未來也有希望自動化。
功過相抵,中規中矩。”
散會后,盧赫坐到電腦跟前,摩拳擦掌。
雖然不是專業人士,但一直跟進這方面進展的他,始終覺得那些在數年間如雨后春筍般涌現出來的大幾十種方法里,強化學習最有前途。