ブログ

FFRI BLOG

2013-12-19  Jubatus Casual Talks #2に参加しました

事業推進本部の村上です。

12/14に開催されたJubatus Casual Talks #2に参加しましたので、簡単に様子をレポートしたいと思います。Jubatus Casual Talksは、オンライン機械学習向け分散処理フレームワークであるJubatusの開発チームが主催している機械学習に関する勉強会です。性質上、Jubatusに関連した発表が多いですが、テーマ自体は必ずしもJubatusに関連する必要は無く広く機械学習に関する発表、情報交換、人材交流を目的とした会となっています。

この会自体は、2回目の開催となりますが、第1回は定員110名に対してそれを超える参加申し込みがあり、キャンセル待ちが発生するという状況でした。今回も定員100名に対して150名の申し込みがあり、機械学習という技術に対する関心の高さが伺えます。もちろん、勉強会としては大規模な部類に属し、こうした規模ではお馴染みの(株)インターネットイニシアティブの会議室で開催されました。

具体的な発表内容は、イベントページに譲りますが、「異常検知編」が今回のテーマとなっており、Jubatus開発チームからの機械学習チュートリアルや最新リリースのアップデート報告等の後、外部発表者による異常検知に関する発表が行われました。私も教師あり異常検知という観点でマルウェア検知について発表させて頂きました。内容としては、PacSecの発表と共通点が多いため、興味のある方はこちらをご参照ください。

既に発表資料の一部がslideshare上に公開されているため、確認できたものを簡単にご紹介したいと思います 。

■機械学習チュートリアル

機械学習とはなにか?という話からその種類や長所・短所等、一般的な話をまとめた内容となっています。

■異常検知入門

異常検知とはなにか?という話からその手法、関連ソフトウェア、今後の展望についての内容になります。12月5日に開催されたNIPS2013で発表された内容に関するフィードバックも含まれており、初歩から最新の情報まで分かりやすくまとまっています。

■0.5.0の新機能(クラスタリング)の紹介

11月22日のリリースされたJubatus 0.5.0でサポートされたクラスタリングについての紹介になります。このバージョンでは、アルゴリズムとしてK-Means及びGMM(混合ガウスモデル)がサポートされ、コアセットとしてデータを保持することで無作為抽出に対してデータセットの概形をより正確に保つことができる等の特徴が報告されました。

■Jubatus開発者入門

開発チームによるJubatus開発に関する体制や仕組み、開発状況に関する発表になります。Jubatusはオープンソースですので、なんらかの形でコントリビュートしたい方にとって有益な情報となっています。上記の他にもマルウェア検知を例にJubatus分類器の活用に関するテクニック、画像・映像を対象とした異常検知に関する話、Jubatusの実Webサービスでの利用例等、様々な発表が行われました。いくつかの発表に関しては近いうちに発表スライドが公開されるのでは、と思います。

会終了後の懇親会まで含めると13:00~21:00の8時間と実に長丁場でしたが、自分の専門領域とは違う方々とお会いすることができ、とても良い体験をすることができました。実のところ、私自身は機械学習に関してはユーザーの立場であり専門家ではないため、この1日で10弱の知らないアルゴリズムや手法、ソフトウェアがメモ上にリストされています。個人的には、研究は自分の専門知識・技術と他の専門知識・技術の掛け算と考えているためこうした自分にとっての未開地を日々開拓することが非常に重要だと考えています。


関連記事

Monthly Research 「動的情報に基づいたマルウェアのクラスタリング」

SECCON四国大会、CSS/MWS、PacSecに参加します

Monthly Research 「機械学習のセキュリティ技術応用」

pagetop