10/18(月)-22(金)に伊豆修善寺にて、国内のライフサイエンスデータベースプロバイダ、アプリケーション開発者、ユーザ向けの技術勉強会であるBH10.10が開催されている。BHはBioHackathonの略で、このHackathonという言葉は、”hacking”(ハッキング)と”marathon”(マラソン)を合成した造語で、あるテーマに興味のあるハッカーたちが集まり、現在の問題を議論し、その問題をソフトウェアをハックしまくって解決しようという合宿のことである。BioHackathonはその名の通り、Bio(生命科学)のHackathonである。
DBCLS BioHackathonは2008年, 2009年, 2010年と開催されてきており、2008年は東京のお台場でワークフロー構築のためのWebサービスやデータ交換フォーマットの標準化、2009年は沖縄のOISTでWebサービスの利用によるワークフロー構築、2010は東京のDBCLSでセマンティックウェブによるデータベース統合をテーマに開催され、国内外のデータベースプロバイダ、アプリケーション開発者、ユーザが参加してきた。
BH10.10は、統合データベースプロジェクトの現状と今後の展開、参加者全員のライトニングトーク、データベースおよびサービスと技術のシンポジウム、チュートリアル、オープンスペース、ハッカソンという構成で、活発なディスカッションや情報交換が行われ、国内のデータベースプロバイダ、アプリケーション開発者、ユーザがのべ60人程度が集い、その模様はustreamでライブ中継され、Wikiにまとめられている。
BioHackathon 2008は初日のみの参加だったが、BioHackathon 2009はユーザとしてBioCichlidの開発者として、BioHackathon 2010と今回のBH10.10はアルツハイマー病パスウェイデータベースであるAlzPathwayのデータベースプロバイダとして参加してきた。AlzPathwayは信頼性の高い論文のマニュアルキュレーションにより構築したデータベースで、606分子、840反応について細胞種毎、細胞内局在に 分けてCellDesignerで記述したものである。現在、論文投稿の準備とデータベース公開の準備を進めている。
今回BH10.10に参加した問題意識は、(1) 構築したAlzPathwayのデータベースの継続的な更新をどうするか、(2) AlzPathwayと既存のパスウェイデータとの連携をどうするかということだった。前者は非常にむずかしいことがあらためてわかった一方で、解決のためのヒントを得た。長期的な視野をもって、粘り強く取り組んでゆきたい。後者はBioHackathon 2010でセマンティックWebでの連携を模索したが、こちらも今後継続して取り組んでゆきたい。
今回は途中で帰京しなければならなかったため、ハッカソンには参加できなかったが、シンポジウムもチュートリアルもライトニングトークも非常に有意義なものだった。チュートリアルではなかでも荒川和晴さん(慶應義塾大学先端生命科学研究所)のDashcode 3による次世代ウェブアプリケーション開発は衝撃的だった。さっそく解析の合間にDashcodeをいじっている。
ハッカソンには参加できなかったが、WikiやTwitterをみると、データベースのRDF化からはじまり、オントロジー、Webサービス、Galaxyによるワークフロー、可視化(Cytoscape)、OSQAを利用したあたらしいQAサイトなど、非常に活発にハッカソンが進行しているようだ。
BioHackathon 2008, 2009, 2010で、WebサービスとしてSOAPからREST、ワークフロー、セマンティックWebへと展開し、それぞれのテーマで大きな成果を挙げてきた。国内外のライフサイエンスデータベースプロバイダ、アプリケーション開発者、ユーザが問題を洗い出し、議論し、共通の認識をもって、今後の方向性を模索し、ハックしてゆくという貴重な場で、夜遅くまで飲みながら参加者間のつながりが形成された。DBCLS BioHackathonは非常に有意義な活動で、ライフサイエンス統合データベースセンターの大きな成果だと思う。BioHackathonの活動を支えてこられたオーガナイザーの皆様に心から感謝したいと思いますし、今後もBioHackathonの活動が継続してゆくことを期待しています。