![]() |
ノート/ハックメモ2015前半https://pepper.is.sci.toho-u.ac.jp:443/pepper/index.php?%A5%CE%A1%BC%A5%C8%2F%A5%CF%A5%C3%A5%AF%A5%E1%A5%E22015%C1%B0%C8%BE |
![]() |
訪問者数 4565 最終更新 2015-07-01 (水) 08:58:50
>>2014年後半の分 (このページの前)
>>2015年後半の分 (このページの後)
これは、機械学習技術に詳しくない人でも、これを活用したアプリケーションをつくれるようにするサービスです。つまり、アプリケーションからAPIで、このサービスを呼び出して活用できます。以下では、AWSのブログ、チュートリアルなどの情報に基づき、このサービスが何の役に立ち、どのように使えるものなのかを紹介します。
機械学習とは、ウィキペディアによれば「センサやデータベースなどからある程度の数のサンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出し、アルゴリズムを発展させる」ことを意味します。
Amazon Machine Learningは、アルゴリズムの詳細に立ち入ることなく、また専用の基盤を構築することなく、機械学習のためのデータ解析と予測モデルを迅速に構築できるサービスだとされています。
Amazon Machine Learning サービスでは、機械学習のバックグラウンドのない開発者でも、スマートなデータ駆動型アプリを制作できるツールを提供する。このツールを使えば、リアルタイムで起きていることや過去に起きたことの分析だけでなく、このサービスの一番の特徴である、将来何が起きるかの予測までできる。
Rockchip のRK3288は 4コア Cortex-A17 と 4コアARM Mali T760を組み合わせた、セットトップボックス向けのSoC。チップとしては4KデコードやOpenGL ES3.0、GPUコンピューティングのOpenCL1.1にも対応します。
私たち「組込みシステム技術協会(JASA)」でも、「OpenEL(OpenELのホームページ)」というロボットなどに向けた組み込みミドルウエアを産総研などと共に考案し、世界規格として提案している。OpenELはRTミドルウエアの下位に位置し、RTミドルウエア用の各ソフトウエアの可搬性(移植性)を高めるものだ(図1)。
さて、今回はオープンソースソフトウエア(OSS)のミドルウエアを使用して、高度な動作を行う自立型のロボットの制作方法を解説する。私も組み込み業界の中で生きるプロの端くれであるが、今回は個人の趣味として、低い制作費と低い労働力でロボットを制作した。
ディープラーニングにより研究の内容も質的に変化している。最近の研究では、人工知能にプログラムコードを与えるだけで「繰り返しなどの制御文」や「掛け算や足し算の意味」を自動で理解させることに成功している(論文PDF)。2014年には人工知能に人間の短期記憶をもたせるニューラルチューリングマシンと呼ばれる技術が登場し、人工知能が自分で考えた結論を脳内に記憶することができるようになった。この技術は将来、人工知能に論理的な思考能力を与える可能性があり、多くの研究者に注目されている。人工知能にゲームの画面映像と得点情報のみを与えるだけで、人工知能が自身の力でルールを理解し、人間に近い得点をたたきだす研究も存在する。この研究では人間が睡眠中に記憶を定着させる仕組みを人工知能に適用することで、人工知能がゲームのルールを理解するスピードを格段に向上させることに成功した点が注目されている。
なおGoogleはすでに、Casandra、MongoDB、Drupal、Joomlaなど一連の人気アプリケーションに関しては、これと同様の”click-to-deploy“(クリックツーデプロイ)サービスを提供している。今回の新しいサービスは、この既存の機能にBitnamiのパッケージを足したもののようだ。
講演募集案内詳細は http://www.ipsj.or.jp/event/fit/fit2015/appli_paper.html
「査読付き論文」は2015年3月4日(水)から受付を開始しています。
情報科学技術フォーラム従来の大会の形式に捉われずに、新しい発表形式を導入し、タイムリーな情報発信、活気ある議論・討論、多彩な企画、他分野研究者との交流、などを実現してきております。皆様の研究成果発表の場として、論文発表を募集致しますので奮って御 応募下さい。
「猫も杓子もGoogleの「スマホ対応」のお墨付きが付いててその上、先日、スマホ対応してないと検索ランキング下げるかも?とか脅してくるので(Googleが)、仕方なく対応。」
実はこのサイトにもこの警告が、来たんですよね。
「重大なモバイルユーザビリティ上の問題を検出」
Google のシステムは、貴サイトの 214 ページをテストし、そのうちの 100% に重大なモバイル ユーザビリティ上の問題を検出しました。この 214 ページの問題の影響で、モバイル ユーザーは貴サイトを十分に表示して楽しむことができません。これらのページは Google 検索でモバイル フレンドリーとは見なされないため、スマートフォン ユーザーにはそのように表示、ランク付けされます。
<知ったことかい>とも言えないので、探してみたらこのページにちょっとした解決案があった。
あと、こんなの >>>> PukiWiki Advance もあった。ただ、Plusの時にもあったが、標準版から外れるとそれなりにやっかい。
Raspberry PiやArduinoもいいけれど、パソコン入門といえばやっぱりBASIC
秋月電子通商は3月4日より、こどもパソコン「IchigoJam(いちごじゃむ)」ボードの取り扱いを開始した。
IchigoJam.netが開発した入門用ワンボードマイコンで、キーボードとテレビを接続できるコンピューターとして機能する。PS/2キーボードを接続でき、NTSCビデオ出力でテレビに接続して画面上でBASICプログラムを作成でき、内蔵メモリーにプログラムのセーブ/ロードもできる。外部入出力端子もあり、スピーカーを接続すればBEEP音やサウンドを鳴らすこともでき、各種センサーからの入力値を取得、出力端子に接続した機器をコントロールすることも可能、
キット内容は基板のほかプログラムが書き込み済みIC、入出力端子など最低限のハンダ付けで組み立てることができる。ICソケット付きなので安心(直接ICをハンダ付けすると熱で壊してしまう可能性がある)
基板サイズは45×62mm。プログラムは書き込み済みで、組み立てにはハンダ付けが必要。価格は1500円。
強力なアルゴリズムを発明した研究者とソフトウェアのデベロッパーを結びつけるマーケットプレイスのプライベート・ベータテストを開始した。
このマーケットプレイスにはすでに機械学習、音声画像処理、コンピュータビジョンなど800のアルゴリズムが登録されており、デベロッパーのさまざまなニーズに応じられるようになっている。
このサービスに登録されたアルゴリズムのデモとして、サイトにはウェブ・クローラーの動作をシミュレートするアプリが公開されている。これには7人の研究者のアルゴリズムが利用されているという。クローラーの動作はビジュアル化され、ノードの重要性に基いて色分けされる。ノードごとのページランクも一覧表示される。
Twitterの全ツイートのフィードであるFirehoseはマーケティングの改善に務める企業にとって金鉱のように貴重なデータを提供してきた。今や、Facebookもプラバシーの安全を保った上で同種の宝の山を提供しようとしている。
(中略)
たとえば、「ヘアー・トリートメントを販売している企業は湿度が髪に与える影響について語っている人々の人口動態的情報を得ることができる」という。
近況に「空気が乾いて髪がちりちりになって困っている」という投稿が多い日はヘアートリートメントの広告表示を増加させるのに適しているというわけだ。
これにより、iPhoneを利用している患者の活動や症状、健康状態を測定・調査するアプリの開発が可能になる。
Googleは「単一の学習システムが経験から直接学習して問題を解決できるようになった最初の例だ」と評価した。
Hello AutoEncoder
これもある意味Deep Learning,Recurrent Neural Network Language Modelの話 [MLAC2013_9日目]
自然言語処理のためのDeep Learning from Yuta Kikuchi
Matsuda氏のスライド Practical recommendations for gradient-based training of deep architectures from Koji Matsuda
Bengio Practical Recommendations for Gradient-Based Training of Deep Architectures
品川区立京陽小学校は2015年2月23日、国語・算数・理科・社会・図工・音楽などの授業へプログラミングを取り入れる試みに関する成果報告を行った。同校では2014年度から、全校児童に1人1台のRaspberry Piを配布。プログラミング言語「Scratch」を使い、教科学習の理解を深めるための手段としてプログラミングを活用してきた。
同日に一般公開された2年生の国語の授業では、「主語と述語の関係」や「時制による語尾変化」の学習で、Scratchを利用した。児童たちは、まず主語と述語を使った例文を作り、その動きをプログラミングによって視覚化した。その後、述語が時制によって語尾変化することを学び、始動・継続・完了などの動きがプログラミングされたキャラクターの状況を文で表現した(写真1)。
…
メディアルームで実施された1年生の図工では、Raspberry PiとScratchを利用して、児童たちの描いた魚が泳ぐ水族館を表現した。これまでの3回の授業で、クレヨンで書いた魚の絵をデジタルカメラでRaspberry Piに取り込み、Scratchを使って魚の動きを表現するスクリプトを作成するところまで完了させた。同日の4回目の授業では、友達が描いた魚の絵を、自分のコンテンツに取り込み、魚の数を増やすことを行った(写真3)。
新規格は、Googleが2009年に発表したプロトコルであるSPDYをベースとしている。同技術は、Google独自の「Chrome」ブラウザ、Mozillaの「Firefox」、Microsoftの「Internet Explorer」の他、Facebookなど多数のウェブサイトやソフトウェアで採用されている。
SPDYとHTTP 2.0の中核にある機能は接続の「多重化」である。多重化とは、ウェブブラウザとウェブサーバの間の多数のデータ転送リクエストをまとめて単一の基盤ネットワーク接続で送るようにする技術だ。演算リソースの観点において、こうした要求のセットアップにはコストがかかり、ウェブの複雑化に伴い、課題となっていた。
「原因はあの1行のコードだとDeakin氏と述べた。同氏は、そのコードが1990年代からシステムに存在していたことを認めた。」
今回開発されたアルゴリズムは 「deep convolutional neural network」というニューラルネットワークを用いて学習させる手法で開発されているとのこと。研究者らは20万の様々なアングルから撮影した顔を含む画像と顔を含まない2000万の画像を合わせたデータベースを作り、128の画像を1つのバッチとして5万回繰り返し学習させたという。このような多階層ニューラルネットワークの学習によりアルゴリズムの精度を向上させたとのこと。特に以前は非常に難しかった上下逆さまの顔の識別が飛躍的に向上したとのことだ。
英国貴族院のデジタルスキル委員会は、学校のカリキュラムにおいて国語や数学と同じくらいデジタルリテラシーを重要な科目とするべきだという提言を発表した。
無償配布を始めるのは、米国のセキュリティ関連の非営利団体「ISRG(Internet Security Research Group)」。米電子フロンティア財団(EFF)や米アカマイ・テクノロジーズ、米シスコシステムズ、米モジラなどインターネット関連の名だたる企業や組織がスポンサーとなっている。このISRGが現地時間2014年11月18日、「Let’s Encrypt」というプロジェクトを立ち上げ、2015年夏にSSL証明書の無償配布を始めると発表し、世界中に衝撃を与えた。
無料なのはいいんだけれど、SSL化するとファイヤウォールに入れたウィルスチェッカーでは検出しなくなるのでは?
1回3分程度の学習用動画コンテンツが再生され、その下には補足説明やヒントが表示される。それを参照しながら右側に表示されるプログラミングエリアにコードを書くと、そのままWebブラウザ上で実行され、結果を確認できる仕組みだ。
今回のアンケートは、量子力学の数理を適用したマーケティングエンジン=「Scanamind」を使って行われました。Scanamindは、本人も答えようがない無意識の概念構造を量子数理で可視化するツールで、テーマに対してあらかじめ質問を用意するのではなく、回答者自らがつくった質問に本人自身が直感的に回答していくことで、回答者の無意識を構造化する仕組みになっています。
今回WIREDが行ったアンケートでは、「これこそが日本のよさだ」と思うキーワードを回答者自身が12個挙げ、あとは、ランダムに出てくる2つのキーワードの関連度(強い関係がある/少し関係がある/関係は薄い/ほぼ無関係)を直感的に選んでいくかたちで進められました。
12項目の全組み合わせなので、全部で66の質問項目を、回答者のみなさまにはお答えいただきましたが、この66の質問項目は回答者ごとにすべて異なるので、いわゆる集計作業は行えません。つまり、従来のマーケティングで活用される統計数理を適用することはできません。そこでScanamindでは、波動方程式という数理を用いて各回答の「固有状態」を解析することで、概念構造を自動的に生成するシステムを採用しています。その結果が下のマップです。(以下略)
NTTコムウェア株式会社は9日、SNSなどで投稿される不適切な画像コンテンツを識別するフィルタリングシステムの開発に成功したと発表した。また、同日よりデータセクション株式会社と共同で商用化に向けたトライアルを開始した。
機械学習技術「Deep Learning」を活用し、対象の画像を「スコア」という数値で評価することで、これまで有人による目視監視が必要だった不適切なコンテンツをフィルタリングできる。
Deep Learningでは通常、犬や猫といった1つの物体(クラス)を習得するのに100万枚ほどの画像が必要だが、NTTコムウェア独自の学習方法により、1万枚程度の画像を読み込ませるだけで精度の高いエンジンに仕上げることが可能だという。
この技術には、「深層学習(ディープ・ラーニング)」(日本語版記事)と呼ばれるAIが使われている。深層学習は大手ハイテク企業の間でブームとなっており、人間の知覚レヴェルに近いソフトウェアが各種登場している。
たとえば、グーグルは「Android」の音声認識機能の強化に深層学習を利用している。マイクロソフトは「Skype」向けのリアルタイム通訳(日本語版記事)機能の開発に深層学習を利用している。フェイスブックは、写真のすべての人の顔に自動でタグを付ける機能を、深層学習を使って改善している。
そして、深層学習は近いうちに、動画を検索する方法も変えるだろう。マシンが動画を分析し、その中に何が映っているのかを瞬時に理解するようになるのだ。
売上でも利益でもアナリストの予想を上回る好調な第4四半期決算を受けて、Twitterの株価は7%ほど上がった。しかし同時に成長が大きく減速していることもはっきりした。
専門知識がない人でも無料でネットショップが作れる「STORES.jp」のストア数が、20万店を突破した。2012年9月にサービスを開始して以降、ストア数は毎月5%程度の右肩上がりを続けてきたが、2014年9月にリリースした「フォロー機能」によってストア数が急増。9月以降は毎月15%以上の伸びをキープしていて、対前年比では270%の成長だという。
フォロー機能とは、特定のストアの最新アイテム情報を、STORES.jpの自分のページで受け取れるようにするもの。お気に入りストアの新着アイテムを逃さないようにする、「買い手」のための機能だ。それがなぜ、ストア数の拡大につながったのか。STORES.jpを運営するブラケットの光本勇介社長によれば、こういうことらしい。
「ニーズ断捨離モデル」では、少人数の顧客開発チームで、お客様に、製品を開発する前にひたすら仮説検証を繰り返す。先のフレームワークが、この仮説検証の「仮説」に相当する「お客様が買う理由」になる。しかしこれはオフィスでいくら考えても、絶対正解にはならない。そこで正解にたどりつくために、リアルのお客様が本当に買うかを検証するのだ。
「IT業界におけるアジャイル開発と同じ考え方である。商品を開発する前にお客さまに会い、課題を検証し、学習を積み重ねていく。このとき興味を示さない99人に聞くのではなく、興味を持った1人に聞くことが重要。仮説検証のPDCAサイクルをスパイラルに回し、ステップアップする。仮説検証なしにお客さまに会っても言いなりになるだけだ。このとき、いかに上手に失敗するかが重要だ。まず常に新しいことに挑戦する。ただし挑戦には失敗がつきものであることを覚悟し、失敗しても大きな問題にならないようにする。挑戦の規模を見きわめ、ギャンブルを避けることも必要。失敗を失敗と認められなければ学ぶことはできない」(永井氏)。
Twitterから調査のために8億2,600万件にのぼるツイートのデータを取得し、そこから位置情報を含む、約1,300郡から投稿されたツイート約1億4,600万件を抽出した(ツイート件数が5万に満たない郡は調査から除外した)。
次にチームは、感情表現に関して定評のある辞書を参照し、特定のフレーズがツイートに登場する頻度によって、個々の郡の「健康レヴェル」を評価した。健康や仕事、魅力などに関するネガティヴな表現、または罵り言葉の多用がみられると、その郡には「高リスク」の評価が与えられ、反対に、「チャンス」「克服」「週末」などの単語が使われていると、「疾患に対して予防的」との評価が加算された。
実は、科学的な研究(結果/論文)でも、数字は他人を信用させるためのものなのですよね。(全部とは言わないにせよ、多くの場合…)では、直接的な営業成績のアップが目的ではないなら、営業マンは日々の仕事のなかで、どういった目的で数字を活用すればいいのでしょうか? この問いに対して、著者はひとこと、「周囲から信頼されるため」だと断言しています。
データベースに登録されていた名前とパスワードは、プレーンテキストで保存されていたという。キャッシュの記録からは、顧客たちが数千ものインターネット・アドレスに対する攻撃に、ビットコインで11,000ドルを支払っていることがわかる。この情報は、対抗するギャングのメンバーや、世界中の捜査当局にとって興味深いものに違いないだろう。
彼らにとってこの顧客情報は、本来慎重に取り扱われるべきものだった。しかし、この漏えいを受け、LizardStresserサーヴィスに対する闇市場からの評価は“終わった”とみて間違いないだろう。
世界のエグゼクティブの間でひそかに共有されているスピーチがある。20世紀後半のアメリカを代表する知識人、ジョン・ガードナーが説いた「自己革新」(self-renewal)の教えだ。『ファストカンパニー』の創刊者テイラーは、自己革新の核となる「好奇心と学習」をリーダーの最も重要な資質であると強調する。
Facebookも、この分野にかなりの貢献をしていて、今日(米国時間1/16)同社は、機械学習のためのコンピューティングフレームワークTorch7プロジェクトの一部をオープンソースにする。Torchはこれまでも、大学の研究室や、Google、Twitter、Intelなどの企業で機械学習や人工知能のプロジェクトの中核として利用されてきた。