![]() |
ノート/ハックメモ2016後半https://pepper.is.sci.toho-u.ac.jp:443/pepper/index.php?%A5%CE%A1%BC%A5%C8%2F%A5%CF%A5%C3%A5%AF%A5%E1%A5%E22016%B8%E5%C8%BE |
![]() |
訪問者数 1050 最終更新 2019-01-18 (金) 09:20:35
>>2016年前半の分 (このページの前)
>>2017年の分 (このページの後)
アプトン氏がRaspberry Piを開発した背景には、学生のコンピュータサイエンスにおけるスキルの低下があるという。Raspberry Piのアイデアを思い付いたのは2006年。当時、英ケンブリッジ大学のコンピュータサイエンス分野で教鞭を取っていたアプトン氏は、大半の学生がアセンブリでプログラミングできた90年代中ごろと異なり、年々コンピュータサイエンスを志望する学生が減少し、「HTMLでウェブページを書いたことがある程度」まで、スキルが低下していることに課題を感じていたという。
その理由を考察したところ、80年代の子どもはMSXマシンやシャープの「X68000」、コモドールの「コモドール64」といったマシンでプログラミングを経験したことがあるからだという結論に達したという。同氏は、子どもたちが再びコンピュータサイエンスに興味を持ってもらえるよう、「プログラミング可能なもの」「おもしろいもの」「頑丈」「安価(教科書と同じ25ドル程度)」の4要素を持つコンピュータの開発プロジェクトを開始した。
機械学習やDeepLearningの知識がゼロな文系出身エンジニアがTensorFlowを使って、これまた業務で触ることのないiOSアプリを一から作っています。
今朝、GoogleはデータビジュアライゼーションツールEmbedding Projectorをオープンソース化すると発表した。このツールは機械学習の研究者がTensorFlowをインストールして走らせなくとも、データを可視化するためのツールだ。
2016年11月、アメリカ・ワシントン大学の研究チームがクラッシック音楽を解析した膨大なデータセット「MusicNet」を公表しました。このデータセットは330曲に及ぶライセンスフリーの音源を解析したもので、演奏されている全ての音の音程や発音/終音したタイミングなどを、「◯分△△秒から××秒まで『ラ』の音が鳴っている」という非常に細かいレベルでデータ化することに成功しています。その結果、音のデータの数は100万個以上にものぼっているとのこと。
Alphabetの人工知能部門であるDeepMindは米国時間12月5日、「DeepMind Lab」をオープンソース化することを発表した。DeepMind Labは、エージェントベースのAI研究のための3Dゲームのようなプラットフォームだ。
Elon Musk氏やAmazon Web Services(AWS)などが支援する非営利のAI研究機関OpenAIも、「Universe」をリリースすることを発表した。Universeはさまざまなゲームやウェブサイト、アプリケーションで汎用人工知能を訓練するためのソフトウェアプラットフォームだ。
Googleは、従来版にも機械学習の手法を取り入れていた。ただし従来版では 文章を単語ごとに区切り、それぞれの単語を訳して組み合わせる「フレーズベース」のモデルを採用していた。ニューラルネットを採用した新モデルは、同じ文の他の単語とのつながりを基に文脈を学習し、「全体を見てそれぞれの単語をどのように訳したらよいのかを決める」(シニアエンジニアリングマネージャー 賀沢秀人氏、写真2)。例えば「A、B、Cの順で単語が来た場合は、Aの意味は○○だ」と認識する。この仕組みによって、従来版よりも正確度の高い訳語の候補を見つけ出せるようになった。賀沢氏は 「Google翻訳を長年担当しているが、その中でも飛び抜けて大きな成果だ」と胸を張る。
米Amazon Web Services(AWS)は2016年⒒月30日(米国時間)、コグニティブコンピューティング/ディープラーニングを活用した新サービス、「Amazon Lex」「Amazon Rekognition」「Amazon Polly」を発表した。提供開始済みの機械学習サービス「Amazon Machine Learning」と合わせ、「Amazon AI」という名称で同社のAIサービスを推進する。また、同社はディープラーニングフレームワークとして「MXNet」を優先的に採用し、これを推進していくことを明らかにしている。
本日、Amazonも会話AIを開発するスタートアップ向けにアクセラレータープログラムを新設することを発表した。
Amazonが同社のイベント「AWS re:Invent 2016」で発表した新しいサービスの1つが「Amazon Rekognition」です。Amazon Rekognitionは、ディープラーニング技術を利用して画像に何が写っているのか、被写体の人物は笑っているのか、など強力な画像分析が特長のサービスになっています。
ChainerでDeep Autoencoderを作ってみる (2016/07/05)
ChainerでAutoencoder(+ trainerの使い方の備忘録) (2016/08/09)
【ディープラーニング】ChainerでAutoencoderを試して結果を可視化してみる。 (2015/07/17)
chainerでAuto Encoderの作成と学習 (2015/08/18)
chainerでStacked denoising Autoencoder (2015/09/16)
chainer-Variational-AutoEncoderを使ってみた (2015/09/21)
変分オートエンコーダの仕組みとその実装 (2015/06/27)
猫でも分かるVariational AutoEncoder (2016/07/30)
チューナーレスなので、現行チューナーへの出費を抑えつつ今後の4K放送に対応できる。
「基礎研究への研究費が削られている」といった指摘に対し、データを明示して説明した。
本連載「Deep Learningで始める文書解析入門」では、Deep Learningの中でも時系列データを扱う「Recurrent Neural Network」(以下、RNN)と、その応用方法としてリクルートグループ内で取り組んでいる原稿校正(誤字脱字の検知)の実現方法について解説してきました。
連載第1回ではRNNの概要や活用例について述べ、第2回の前回では、「誤字脱字の検知」というタスクの概要を紹介し、それに対してRNNをどのように活用したかを紹介しました。
前回の最後でも述べましたが、誤字脱字の検知という課題に対して始めからRNNがうまく機能したかというと、答えは「ノー」です。「文字の系列から次の単語を予測するRNNを“異常検知”的に利用する」こと自体は、うまく機能しているようでした。
しかし、英語に比べ日本語の文法は思った以上に複雑で、特に、前回『「誤字脱字」の3つの定義』の1つとした「助詞の識別」は困難を極めました。また、助詞以外では、名詞において、「その単語数の多さから誤った検出をしてしまう」などの問題がありました。第3回となる今回は、それらの課題を乗り越えるために行った精度向上の工夫を紹介します。
このOrange Pi、当初はRaspberry Piのクローンとして15ドルの値がついたコンピュータだった。そこにシリーズの一環として、フル装備モデルが登場してきたのだ。
わずか2000円強でAndroidやLinuxを動かせるギガビットLAN搭載のシングルボードコンピューター「Orange Pi PC2」が登場
中国・深圳のShenzhen Xunlong Softwareが、64ビット対応のシングルボードコンピューター「Orange Pi PC 2」を発売しました。Orange Pi PC 2はAndroidやLinuxを動かせる格安の極小コンピューターとなっています。
チャットボットのブームであるようだが、実際に役立つものが少ないと感じている人も多いようだ。しかし言語学習の際に利用できれば、それはきっと便利なのではないだろうか。学習した内容を、コンテキストの中で使ってみることができれば、身につく度合いも変わってくることだろう。とくにオンラインで学習している場合、習ったことを試してみる相手が周りにいないケースが多いだろう。そういうケースに対処しようと、DuolingoはAIを活用したチャットボットをアプリケーションに導入することにしたのだ。
動画は静止画よりも含まれる情報が多くなることで分析が難しくなるため、静止画に比べて動画用のデータセットは不足しているのが現実です。この状況を改善するべくGoogleの研究チームが、4800件のナレッジグラフのエンティティでタグ付けされた800万本ものYouTube動画のデータセット「YouTube-8M」を公開しました。〜 >YouTube-8M: A Large and Diverse Labeled Video Dataset for Video Understanding Research
Google翻訳ではこれまでフレーズベースで機械翻訳するPBMTというシステムが採用されていましたが、このような単語やフレーズごとに機械的に文章を翻訳する方法ではなく、文章全体をひとつの翻訳単位として捉えることができるのがGNMTだそうです。
GoogleはGNMTの精度を高めるために、中国語から英語への翻訳限定でGoogle翻訳にGNMTを実装済み。中国語から英語への翻訳は、ウェブ版とモバイル版を合わせると1日当たり1800万件程度あるそうで、これらは全てGNMTが処理しているそうです。また、今後数か月以内に他言語での翻訳時にもGNMTが使用される予定とのこと。