AMA | Bioinformatics scientist 修煉路上

Posted by tianlinhe on September 12, 2021

AMA | Bioinformatics scientist 修煉路上

前文:

這是我今年九月在豆瓣小組Women in Biotech/Pharma 醫藥行業女性發佈的一篇AMA。AMA即Ask Me Anything,作者先簡單介紹自己的履歷和願意分享的經歷,參與者可以問作者任何問題——當然是相關的啦!我留意到在2020年左右,以女性互助為主題的小組如雨後春筍般冒出,比如人數最多的Women in Tech,Women in Law,還有更加小眾一點的Women in Social Sciences等等。

正文:

組裡有小伙伴對bioinformatics scientist好奇嗎?

先說說我的個人經歷吧,在bioinformatics的道路上我算是半路出家:本科學biotechnology,碩士開始接觸生物信息,上手編程,剛剛念完的博士方向是clinical proteomics, 100% dry lab 做data analysis。年底會入職一間NGS公司成為bioinformatics scientist新人~

如果大家有轉專業或者怎麼找相關工作的疑問,特別是生物背景的小伙伴,我很樂意解答!那麼這裡會從三個方面寫寫我的分享:轉專業,找工作,還有怎麼在讀博中學習。

一、轉專業:

心意已決的話,轉專業越早越好。如果是考慮大學畢業留學歐洲的話,有兩點可以注意一下:

  1. 大部份歐陸學校不接受本科生申博

  2. 研究生的話各國皆有利弊,比如德國限專業比較嚴但是不要學費,北歐和英國相對寬鬆但是貴

像我的碩士學校只要本科是醫藥理工相關(生化,藥學,甚至化學工程)都能申請,但必須修過數門指定科目(我大約記得有生物化學,還有基礎數學?)可以說是很親民了!

至於要不要轉專業呢?這個問題要留給大家自己決定了。我個人的感受是,工作量上看dry lab 不一定比wet lab輕鬆,但時間自由啊,精神壓力也小:做cloning的時候一步錯,好幾天的工作就浪費了(更不用說動物實驗了),但寫程序的話改改重跑就好。另外一點是,在wet lab裡skill sets都差不多,有的壞老板會覺得換誰來都行,對bench scientists毫無尊重可言;相比來說bioinformatics算是學習曲線比較長的技能,飯碗穩穩的。

二、找工作

我的申請是100%領英上投的。先列一下大家可能比較感興趣的數字:從我投第一份簡歷到收找第一份offer,用了一個月;一共投了19份簡歷,收到七個意向回應,拿到五個面試機會,收到兩個offer(一個拒,還有兩個我沒去面)。步驟是這樣的:

1、撰寫簡歷(兩週左右)

我是在overleaf上下了模板,然後依樣畫葫蘆改。因為自己latex技能比較蹩腳,太複雜的我都改不來,所以下了個簡單的,我記得是個應聘software engineer 的template。

然後重點來了,寫完之後一定要找人讀!!!不僅是為了美化內容,而是為了避免當局者迷啊(論壇上總有人哭訴投了幾百份而石沈大海,往往是因為CV有重大的缺陷而不自知)!而我這位reviewer也是bioinformatician, TA 一針見血地指出了不少問題(readability, repetitive phrases) 。我非常非常感謝TA!

2、投簡歷 (三週)

在LinkedIn上投一個還蠻快的,除了一小部份會要求personal statement。因為我投的職位比較diverse, 有藥企,biotech,還有兩個是學校裡面的scientific programmer,所以每份CV我都稍改了一下,以求在保持真實的框架內最大程度和job description重合。

這樣做會稍花時間,一晚上往往只能投一兩個。但從最後的結果來看,顯然是值得的😊

有的姐妹可能會問職缺是怎麼找的:我在領英的Jobs上設置了地域和關鍵詞的filters和notifications。另外,其實只要多搜搜,它的推薦就會相當準確啦~另外的另外,我也沒買premium membership,所以真的不是打廣告🤣

3、面試

我是復活節假期開始投的,然後節後上班第二天,就收到了兩個hr來電(對,打到我手機,所以電話要常開著)。現在回看整個面試的經歷,三面是在業界最常見的:

第一面(電話)和hr聊半個小時,回答一些yes/no問題,比如說:

「你簡歷寫你會用Python?」

「對」

還會有一些老生常談的問題,比如「請介紹一下你自己」。對於第一面我摸到了幾個小竅門:

  1. 準備一個基本question list,并且寫好和記好response。針對我不擅長即興發言的缺點,我覺得有底稿會讓我更加游刃有餘,言之有物。(當然如果你口語能力很好,就無需太花時間啦)

  2. 保持笑容。這招很有用,大概是笑聲能給人自信和從容不迫的印象吧!

到了和manager的第二面,專業問題就會開始出現啦!從第一面到第二面,一般會有幾日至一星期的時間。好好利用這段時間,一定要上glassdoor搜第二面的問題!如果沒有的話看看同類公司也行!我自己比較驚訝的是我被問得最多的是統計和ml,sequence alignment這種反而一個都沒有😂。我現在猜可能是因為我沒有NGS經歷,所以問起來怕大家都尷尬??😅

好啦終於到了最終面!最終面的對象常常是group leader + manager + senior scientists, 人數四到十人不等。形式因公司而異,一個比較常見的組合模式是

  1. Presentation of your PhD project (10-15 mins)
  2. Presentation of a given topic (10-30 mins)
  3. Individual interviews by panel members (time varies, mostly 30 mins X N )

聽著是不是還好,但大家可能記得我簡歷中率算比較高,所以這時候是三面疊著二面加好幾個一面。 幸好我的所有面試都是網面(這就是新冠肆虐時期的特色),否則最後一面如是on-site ,那就肯定應付不暇了😂😂所以大家搞申請還是要量力而為。

我給大家的建議是好好準備1)和2)!再次針對我應變能力差的弱點,我準備了精確到每個標點符號的講稿并且讀熟。只是讀熟而已,因為真的沒時間背啊!這裡推薦大家試試powerpoint 的presentation mode,全程念稿沒難度,但我怎麼當時沒發現!

找工作就先寫到這裡,大家還有什麼問題歡迎踴躍留言!我下面列了幾個豆油收到的:

  • 專業適配度重要嗎?

在德國可能更重要(你想想他們這個碩士就不讓轉專業的傳統),但姐妹有心宜的機會還是要衝衝衝呀,反正申請不花錢,簡歷拒就拒唄😄

  • 面試完要不要寫感謝信?

不清楚,我沒寫,所以可能不影響?😅

(呃好像豆瓣不讓評論了??我一個人打字真的很尷尬!要不是有姐妹提醒我還以為沒人在看呢。歡迎大家轉發代替評論,輕輕支持一下,我會經常看!)

三、學習

博士入組的頭幾個月個,深深的失望與懷疑包裹了我。在我導師的帶領下,組裡的風氣就是水文—用水來的文申基金—用申來的基金繼續水文,這樣一個循環。退學再申請吧,當時我并沒有真正的bioinformatics project的經驗,不一定能再找到一份100%dry lab的工作。

那怎麼辦呢?只好自強吧。

從博一下學期開始,我走上了孤獨的學習和探索的道路。以下會以時間順序列舉我的一些嘗試,不敢說是最好的,勝在全部親測可行:

千萬不要被Mathematical嚇退呀姐妹!它的prerequisite大概是學過高數,懂calculus和linear algebra就差不多了。我的學習方法是1)記課堂筆記2)完成堂後小測3)老師課常上證過的證明我會自己再推導一遍。

我自己是上的免費版,要不要買課視乎姐妹的需要!買了之後會有證書,可以在領英上分享以及認證。學習資源好像都差不多。

  • 算法及數據結構:Introduction to Algorithms by Cormen, Leiserson, Rivest, Stein (CLRS)

CLRS是一本比較有名的CS敎科書,也很厚,網上有PDF資源:https://edutechlearners.com/download/Introduction_to_algorithms-3rd%20Edition.pdf

大家可以先看看頭幾章再決定買不買。那這樣一本厚書該怎麼讀呢?我跟隨了一個高贙貼子,來自Facebook software engineer Jimmy Saad: https://www.quora.com/What-should-I-know-from-the-CLRS-3rd-edition-book-if-my-aim-is-to-get-into-Google

他在貼子裡劃了重點和可以忽略的章節,我覺得對bioinformatician同樣適用。

我是這樣讀這本書的:把正文裡列舉的pseudo codes全部寫成python代碼并運行,以及完成exercises。遇到實在不會的網上找答案,我推薦這個網站:https://sites.math.rutgers.edu/~ajl213/CLRS/CLRS.html

  • 數據科學:Python Data Science Handbook by Jake Vanderplas

一本不得不讀的好書,深入淺出地介紹了玩轉ds的四個python包:Numpy, Pandas, Matplotlib和scikit-learn。作者還貼心地提供了全書的jupyter notebook:https://jakevdp.github.io/PythonDataScienceHandbook/

雖然讀這本書之前已經多多少少用過這幾個包,但是,,,我直呼相見恨晚!

  • 數據庫:SQL基礎教程,作者MICK

因為工作上偶爾需要從數據庫抓資料,而我又很不喜歡用鼠標勾來勾去,所以學了一點SQL。這裡推薦一本日本作家的SQL入門書,豆瓣評分蠻高的:https://book.douban.com/subject/24841239/

這本書不僅條理清晰,而且圖文美觀;不囿於某個特定的SQL語言,而是耐心地羅列出不同語言的區別,可以說是非常適合初學者了。我看完這本書後大概是能做出leetcode上easy的程度,日常就很够啦!

個人感覺SQL(對於我這種級別)屬於學起來不難,幾天不寫就忘,但是㨂起來也快的神奇工具。有時間的姐妹可以考慮學起來,而且不少job qualifications都少不了它^^

以上是我看完的,目前我正在看我未來的manager推薦的一本書,Bioinformatics Algorithm by Philip Compeau and Pavel Pevzner。這本書的作者們創建了一個網站:https://www.bioinformaticsalgorithms.org

在這個網站上讀者們可以選擇閱讀電子書,購買實體書或者報名網課來支持作者。雖然我目前只讀到第五章,但還是想斗膽跟大家推薦一下:太好看了,都給我去磕!!!

先更到這裡~

正文完。

後記:

為什麼選擇在一個只限女性的小組裡發貼子?除了因為相信Women empower women這個信條,小組討論活躍,氣氛友善禮貌是另一個重要原因。從我收到的豆油問題來看,生化環材的小姐姐們不僅彬彬有禮,還很萌萌嗒!甚至還有個姐妹不為問問題,只是因為豆瓣無法回覆,而專門私信來謝謝我,我真的非常感動鴨!這幾天看到貼子的收藏點贊量都在慢慢上漲,如果能成為大家的一點光,我真的很高興😊

另一點是見證了中國政府鉗制言論自由之嚴峻:我發貼時正趕上「清朗運動」,2021/09/06至2021/09/13豆瓣全線因「技術原因」禁止回覆貼子。在我敲打這些文字的同時,貼文正因為「部分内容可能不符合社区指导原则」而被審核,暫時僅自己可見——即使它只是一則分享職業經歷的乾貨貼。

我在想,網友的底線,如果有的話,到底是什麼?