大学の学びはこんなに面白い

大学の学びはこんなに面白い

東京工科大学 HOME> 大学の学びはこんなに面白い> 膨大な量のバイオデータを読み解くためのシステムを構築していきたい!

膨大な量のバイオデータを読み解くためのシステムを構築していきたい!

2017年02月10日掲出

応用生物学部 村上勝彦 准教授

応用生物学部 村上勝彦 准教授

 AI(人工知能)を使った遺伝子データの解析に取り組んでいる村上先生。遺伝子やゲノム情報などのビッグデータを使って、将来的にどのようなことができるのか、お話しを伺いました。

■現在、先生が取り組んでいらっしゃる研究はどのようなものでしょうか。

 昨年、我々の研究チームが開発したのは「AI(人工知能)を使い、相互に関係する遺伝子や機能をデータベースから自動的に見つける方法」です。生命現象を解き明かすために重要な遺伝子の機能情報は、現在、世界中の研究施設や病院などの公共データベースに大量に蓄えられています。本来、生命現象は相互に関わりがあるものですが、これらの機能情報はバラバラに存在しているため、その関係性はこれまで解明されていませんでした。そこで我々はヒト遺伝子の機能情報をデータベースから収集し、AIに遺伝子と機能の関係性を学習させてから、ある特定の機能を持った遺伝子の多さなどの統計的情報を解析。それにより遺伝子や機能情報のあいだに、これまで明らかになっていなかった新たな相互関係を見つけることに成功しました。
 さらに今後は、がんの疾患情報といった別のタイプのデータを加えることで、がんの分子メカニズムの解明などにも役立つのではないかと期待しています。

■遺伝子の情報というのはどのような形で公開されているのですか?

 一般的な研究所が生物の全遺伝子データを公開していたり、病院やがんセンターのようなところが特定のがんに関して独自に解析したものを公開していたりと、データベースの種類はさまざま。さらにそこからミトコンドリアに関する情報だけを整理したもの、というように二次的、三時的に処理したデータもあり、最近ではデータベースのカタログなども存在しているほどにその量は膨大です。さらに毎年100の単位で新しいデータベースが出てきたり、既存のデータも更新されていくので、新たな情報をきちんとキャッチアップし、それが従来わかっていることとどう関係するのか、といったことを考える必要もあります。
 集めたデータを統計的に読み解いたり、断片的な知識をつなぎあわせて論理的な仕組みを作るといったことは、昔は専門家が論文を読んだり研究会やディスカッションをして構築していくものでした。けれど現在ではデータの量が膨大になり、これらのデータをうまく生かすためにはコンピュータを使った解析が必須です。そしてAIを使ってデータを解析するためには、まずはそこに落とし込むためにどういうデータを集めるかが大切です。しかもそうしたデータは全てがわかりやすく数字の形で整理されているわけではなく、論文などに含まれている場合もあります。いろいろな論文からデータを抽出して、AIが扱えるような形に落とし込む作業は、現在、世界的に見ても人が入力する場合とコンピュータ処理で自動的にやっている場合とがだいたい半々という状況です。通常、論文にあるようなデータだと、人が読んでデータ入力する、あるいは簡単な処理だけを事前にコンピュータでやって、その結果を人間がチェックして入力していくことが多い。私はそこをすべてコンピュータに任せる、いわばフルオートにしたいと思い、今、その研究を進めています。

■先生の研究室ではその他にどのような研究をしているのですか?

 受精卵がひとつの個体になるまでには、この遺伝子は手足を作る、こちらはこの臓器を作る、というようにさまざまな遺伝子が役割分担をしています。特定の遺伝子が適切な時期に働き、それぞれの個体ができあがっていく。その設計図のことを「ゲノム配列」といい、ゲノム配列の一塩基だけがちょっと破壊されているだけで、成長が止まったり、体の形が大きく変わったりしてしまうこともあります。
 けれど、そうした情報はまだ断片的にしかわかっていません。そこで少しずつ発見されてきたDNAの遺伝情報をつなぎ合わせて、新しく予測ができるくらいの規則性を取り出すためにはどうしたらいいか。そのための計算方法やソフトウェアの研究開発。さらにそれらを使ったいろいろな生物のDNA配列の意味付けなどを行っています。まだ関係性のわからない知識やデータなどの情報を、解釈するための方法を探す研究ともいえるでしょう。

■ヒトのゲノム配列というのは、全てわかっているのでしょうか。

 一応、誰もが共通のところはこうだろうというゲノム配列は決まっていますが、実際には個人個人で、百万箇所、あるいはもっと多くの箇所で違いがあるということがわかってきています。現在では、もしかすると細胞ごとに違うかもしれないとも考えられていて、細胞ごとにゲノム配列を見ていく研究も行われています。たとえば、がんは初期段階ではがん細胞と正常細胞の区別が難しくて、手術をしてもなかなか取りきれない部分があります。けれどゲノムの働きが細胞レベルで異なっていれば、発生段階で各細胞が将来的にはこうなるということが予測できるので、そこを詳細に見分けることもできる。ですから将来的には、一人当たりひとつのゲノム情報ではなく、体のいろいろな箇所のゲノム情報をセットで持つようになるかもしれません。それこそまさに究極の個人情報になりますね。
 ただ最近は、遺伝子の影響について「これ以上はわからない」ということもまたわかってきているんです。我々の現在の身体状態を作っている要因は、遺伝情報が2〜3割。5割以上が環境や生活習慣などの影響を受けています。その人がどんなことに向いているか向いていないかというのは、最初は遺伝で決められていても、成長するうちに外的要因で変わっていく。とはいえ筋肉の種類が持久力に優れているのか、瞬発力に優れているのかという違いは遺伝子レベルでわかりますし、記憶力や頭の良さ的なものも、ある程度は遺伝で説明できるといいます。ですから今後は幼少期に遺伝的な向き不向きで将来進む道を決める人も出てくるでしょう。

■こうした解析から私たちが受ける影響はどのようなものでしょうか。

 たとえばアメリカでは、1000ドル(約10万円)以下で「あなたの全ゲノム配列がスマートフォンで見られます」というようなサービスがあります。そこにはテスト結果に既知の異常などがあったとき、それが健康に与える影響を解析するカウンセリングまでが含まれています。日本でも似たようなサービスはありますが、いまのところ、知ったところでそれほど心配するような違いではないと私は思っています。
 ただし今後、自分や親戚の遺伝情報がお見合いの釣り書きなどに添えられたり、就職の合否判定に影響が出たりするようなことがあるかもしれません。あるいは保険に入る前にそういう情報をどこまで出さなければいけないか、など、将来的にはいろいろ考えなければいけない問題はでてくるでしょう。事実、法的に遺伝情報をどう扱うべきか、という議論は既に起きています。ですから最近では情報処理の専門家たちも、「倫理とはなにか」「人間とはなにか」といった哲学的な問題を考え直す機会が増えてきているのです。

■先生の今後の目標についてお聞かせください。

 これはまだ単なる夢ですが、いずれ教授の代わりができるようなAIを作りたいと思っています。たとえば授業でわからなかったところなどを問い合わせると、まるでその学生をよく知っているような前提で適切な情報を与えてくれるシステム。いわば「AI教授」のようなものですね。持っている知識の組み合わせなどが違ってくるので一般性を持たせることは難しいでしょうから、たとえば皮膚専門のAI教授とか、特定の癌専門のAI教授というように、小さい範囲でなければ作れないだろうと思います。ただし専門分野に関しては、聞けばなんでも答えてくれる。さらにそれぞれのAIがネット上で独自に情報を更新していき、ときどき通信で情報のやり取りをして、一般性を高めていく。今でいうGoogleやスマホを活用した勉強法の高度なバージョンといったところですね。
 いずれ、そういう未来は来るだろうと思います。それが何年後なのか予想はできませんが、きっと部分的にどんどん実現していくうちに、あるとき予想もしていないような大きな進歩がやってきて、一気に進むのではないかと思います。実は90年代、人間の全ゲノム情報が解析されるまでには最大で100年かかると言われていたんです。それがスタートしてから5年ほどで見通しがたって、10年ほどで全て終わってしまった。原因はコンピュータの進化がひとつ、もうひとつは読み取り技術の飛躍的な進歩でした。
 このようにAI技術が不意に大きく進歩することもあるでしょう。こうした技術の進歩は、アポロ計画のようにお金をかけられる人が莫大なお金をかければできてしまうという側面もあります。現在、AIはGoogleとアメリカ軍が開発に力を入れていて、アメリカ以外の国とは一桁か二桁違う予算をかけて研究が進められています。ですから以外に早く開発は進むと思いますね。既にここ数年の進歩には驚かされるところがありますから。

■最後に学生さんたちへのメッセージをお願いします。

 この分野に進む人は、生物に限らず得意分野を持っているといいと思います。たとえば地理が好きな人であれば、そこから風土病のように特殊な地域にある病原菌の研究につながったり、恐竜に興味があるということから、恐竜の子孫である鳥類の羽の遺伝子を研究テーマにした学生もいます。そういう意味で、この分野はとても間口が広いと思います。少なくとも、生物に関する興味はすべて遺伝子につながりますからね。
 また、皆さんはこれからどんどん変わっていく世界を生きていくことになります。今後、AIが大きく発達していけば、AIができることはまかせて、人間はそこに協調していく。そういう社会を作っていく必要が出てくるでしょう。そこで「人間にしかできないことはなにか」「人間独自の価値観とはなにか」といったことを考えなければいけない。そのためには、いろいろなことを広く学んでおくことが大切です。たとえば情報処理の技術者が倫理について考えなければいけなくなったように、自分には関係ないやと思っていたことが、後々どのように役に立つかわかりません。ですから若い時期には、なるべく興味の範囲を広げて、いろいろな世界を見たりいろいろな経験をして欲しいと思います。

・次回は3月10日に配信予定です。