![]() |
ノート/ハックメモ2015後半https://pepper.is.sci.toho-u.ac.jp:443/pepper/index.php?%A5%CE%A1%BC%A5%C8%2F%A5%CF%A5%C3%A5%AF%A5%E1%A5%E22015%B8%E5%C8%BE |
![]() |
訪問者数 3756 最終更新 2016-08-21 (日) 15:32:30
>>2015年前半の分 (このページの前)
>>2016年前半の分 (このページの後)
Watsonは、米国IBMが開発した質問応答・意思決定支援システム。継続的にインプットされる自然言語の情報を解釈・理解しながら、仮説の形成と評価、ユーザーからのフィードバックに基づく自己学習と能動的な知識の蓄積をする。
(中略)
今回のハッカソンは、入力されたテキストから意図を推定して自動的に分類する「Natural Language Classifier(NLC)」、自然言語の質問に対して検索と機械学習アルゴリズムの組み合わせから関連性の高い回答候補を返す「Retrieve and Rank(R&R)」などの日本語版API(ベータ版)を用いて、新たなサービスの企画・開発に挑戦するというもの。
トヨタ自動車が12月17日、機械学習や深層学習(ディープラーニング)のベンチャー企業、プリファード・ネットワークス(PFN、東京都文京区)に、12月30日付で10億円を出資すると発表した。2014年10月から自動運転などに関する共同研究をしており、約1年の交流を経て、トヨタから出資を提案した格好だ。トヨタはPFNの第三者割当増資を引き受け、外部株主としては、第3位の株主となる。
我々がよく参照する、プリファードネットワークスですな。
「りんな」はマイクロソフトが提供する検索エンジン「Bing」で培ったディープラーニング技術と、機械学習クラウドサービス「Azure Machine Learning」を組み合わせることで生まれた人工知能。これまでLINEのみ提供されてきたが、Twitterとの連携をスタート。LINEと同様直接「りんな」とやりとりでき、リプライを飛ばすとAIエンジンにより返事が返ってくる。
文部科学省が2016年度に90億円の予算を要求して新設する、国内最大級の人工知能(AI)研究拠点「AIPセンター」のトップ人事が大詰めを迎えている。どの分野の人材が就任するのか。予算の配分を大きく左右する人事に、AI研究者らは気をもんでいる。
AIPセンターのセンター長候補として名前が挙がっているのは、国立情報学研究所の喜連川優所長(60歳)をはじめ、日本学術振興会の安西祐一郎理事長(69歳)、前・国立国会図書館長の長尾真氏(79歳)ほか数人だ。
では、現在のAIブームはどうだろうか。その背景としてディープラーニング(深層学習)などのアルゴリズムの進化が引き合いに出されることが多いが、筆者はそれに加えてより高次元の3つの背景があると考える。それは、1)データ、2)ビジネスエコシステム、3)教育の3点がオープン化されたことである。
(Gigazine) わずか600円台のコンピューター「Raspberry Pi Zero」が登場
発表されたプログラムは、物流システムに関連するマネジメント手法を学ぶサプライチェーン・マネジメントの修士課程で提供され、学生は同コースの前期分に値する無料講座をオンラインで受けて、その後に実施されるテストをパスすれば残りの単位をキャンパスでの授業で取得して修士学位をゲットできるというものです。最初から最後まで無料オンライン講座だけで修士学位をゲットできるわけではありませんが、インターネットを通じてサプライチェーン・マネジメントを学習したい世界中の人々に修士学位取得の機会が広がったというわけです。
このパイロットプログラムは2016年2月からスタートし、約40人の生徒の参加を受け付けるとのこと。MITのサプライチェーン・マネジメントはアメリカ国内でトップクラスに位置しているコースであり、学士を取得していったん就職した後に受講する学生が多く、生徒の平均年齢は約30歳で3〜8年の社会経験を積んだ人がほとんどです。レベルの高い修士コースをオンラインで、前期のみですが無料で受けられるのは、高い授業料を払えなかった人たちに新しい扉を開くことになります。
ということは、やっぱりお金をとるんじゃないか。授業部分(の一部?)をオンラインビデオ(無料)に置き換えただけ? 残り部分はどのぐらいの量で、何年かかるの? いくらかかるの?
2015-11-04 機械学習で返信メールを自動生成する機能をGoogleのメールアプリ「Inbox」が実装予定 曰く「Smart Reply」では、受信メールの返信欄に3種類の候補を青文字で表示。タップで選び、必要であればテキストを追加できる。提示する候補は、受信したメール内容に応じて変化。判別は人工知能が行っており、「リカレント・ニューラル・ネットワーク」を採用しているとのこと。
スマートリプライは時系列データを取り扱うことができるニューラルネットワーク「リカレントニューラルネットワーク」を採用していて、受信メールをエンコードするネットワークと、返信候補を予測・生成するネットワークの2つで構成されています。前者が受信メールに含まれる単語を解析してメールの要点を「思考ベクトル(thought vector)」に変換し、後者が返信文を作成。返信文例はシステムが自動生成しているもので、Googleのスタッフがメールの内容を読むことはないそうです。
「ビッグデータディスカバリ」というと、「ビッグデータアナリティクス(ビッグデータ分析)」のためのツールという意味と間違えやすいが、単純に「ビッグデータが扱える」ということを意味しているわけではない。実際、現在のデータディスカバリ(セルフサービスBI)ツールは、一般的にデータ形式としてHadoopなどに対応済みだ。
だが、ビッグデータから有効な知見や洞察を得るためには、データ形式として対応しているだけでは足りないというのが、ホーソン氏およびガートナーの主張だ。大量のデータから、何をどう分析すればいいのかをガイドする機能などの必要性が、今後広く認識されるようになっていくだろうという。一方、高度な統計分析を、より多くの社内ユーザーが実行できるような支援をするツールも、今後求められるようになっていくという。
その通りなので、道具は使えても、どう攻めていいかわからないのでは役立たずであろう。この部分はまだ人を育てるフェーズだと思う。そのうち自動的に考えてくれるようになるだろうけれど。
x-means法はk-means法を拡張したものであり、後者が実行時にあらかじめクラスタ数を指定しなければいけないのに対し、最適なクラスタ数を自動で推定できる点が優れています。 その基本となるアイデアはPelleg and Moore(2000)で初めて提案されました。 今回は、これに改良を加えた石岡(2000)の手法を実装しました。