ノート
訪問者数 10019 最終更新 2019-01-18 (金) 09:19:02
>>2016年後半の分 (このページの前)
>>2018年の分 (このページの後)
(mkdir /mnt/usbhd)
dmesg > /tmp/aaa; vi /tmp/aaa
モデル: I-O DATA HDPC-UT (scsi)
ディスク /dev/sdc: 1000GB
セクタサイズ (論理/物理): 512B/512B
パーティションテーブル: gpt
ディスクフラグ:
番号 開始 終了 サイズ ファイルシステム 名前 フラグ
1 17.4kB 1000GB 1000GB ntfs
mount /dev/sdc1 /mnt/usbhd
終わったら
umount /mnt/usbhd
- 2017-11-16 「2つのAIが“独自言語”で会話」の真相--FacebookのAI研究開発者が明かす 記事中で気になる一言
「AIは自分たちで意思や目標を生み出さない。この実験では、人間がプログラムした“AIエージェントの立場に応じた最適な合意にたどり着くこと”という目標だけを持っていた。その過程で言語が変わっていったのは目標のための最適化から生まれたものであって、人間に何かを隠すような意図をもったというのは、全くクレイジーな狂言だといえる」
意思や目標を生み出し始める境界って本当に無いのだろうか? 今の研究と本当に不連続なのだろうか? 過去の経験の(新しい)組合せは機械にも作れるだろうし、過去の経験から何かを取出して(抽象化?)それを別の経験に注入することもできるかも知れない。(抽象化の部分はまだ難しそうだけれど。)
- 2017-11-14 スパコンでPEZYが巻き返し、省エネで上位独占、性能で世界4位 記事に曰く
その中で目を引くのが、日本のベンチャー企業PEZY Computingと、そのグループ企業が開発するスパコンの躍進ぶりだ。PEZYグループが開発を手掛け、海洋研究開発機構(JAMSTEC)横浜研究所設置された「Gyoukou(暁光)」がTOP500の4位につけた。Rmaxは19.14PFLOPSと、3位のPiz Daintの19.59PFLOPSと僅差だった。
今回のGreen500に入ったPEZYグループのスパコンは、いずれもアクセラレーターに独自の「PEZY-SC2」を使い、「ZettaScaler-2.2」と呼ぶシステムアーキテクチャーを採る。4つのうちGyoukouの電力効率が若干劣るのは、システム全体の性能の向上を優先してプロセッサーを高めの電圧で駆動したためという。なお、ZettaScalerはPEZYグループの1社、ExaScaler社が開発している。
PEZY-SC2はメニーコアのMIMD(Multiple Instruction, Multiple Data)プロセッサーで、1チップに2048の演算コアを備える。Gyoukouの性能計測では、そのうち1984のコアを使い、合計1万の同プロセッサーを利用した。1ノードは8つのPEZY-SC2と米Intel社の「Xeon D」1つから成り、Xeon Dが16コアを備えるため、システム全体のコア数は1986万コア(=1984×1万+16×1250)に達する。約2000万にも及ぶコア数は今回のTOP500の中でも異例の多さで、首位のSunway TaihuLightの1064万9600コアをも大きく上回る。「これまでのTOP500で達成された最も高い並列度のレベル」(TOP500の発表資料)という。
- 2017-11-10 Python web Framework
- 2017-11-09 個人情報DBについて、個人を特定できる名前とか社員番号とかを、パスワード暗号化で使うHASHで一方向変換してしまえばいい、というアイデアについて。
最近は良いHASH関数+salt+多数回ハッシュがよいとされているらしい。全部やってくれるらしいのがBCryptだとか。
^^パスワード保存方法の過去と現在そして未来
- BCryptのすすめ
- Pythonでbcryptを使ってパスワードをゆっくりハッシュ化
なのだが、ここで疑問。
個人情報DBの場合、個人を特定できる名前や何たらをHASHすればいいかと思いきや、逆に戻したい場合があることに気づいた。使い方によるけれど、個人情報DBで何か処理(たとえば統計処理)をして、出力が統計結果だけならこれでいいのだが、個人を特定した出力が得たいとき(「この人は範囲外だから注意しよう」とか言いたい)は一方向HASHでは戻せないからたぶんダメ(ランダムなsaltがあると名前からの全検索も組合せ的に死ぬ!わざとそうしたので当たり前だ!)。となると、素直に暗号化かねぇ。
- 2017-11-09 ということで、Pythonで暗号化 ⇒ PyCrypt。 ところで、公開鍵(RSA?)vs共通鍵(AES?)?公開鍵である必要はなさそうかも。
- 2017-10-19 新聞社説の分析でわかった「民進党がデマの標的になる理由」 記事に曰く(ところどころ抽出)
そこで今回は、拙稿「『稲田朋美』とは何だったのか?もてはやされた『保守政治家』の凋落」(http://gendai.ismedia.jp/articles/-/52947)で用いたテキストマイニングを使って、読売新聞と朝日新聞の2紙の社説を分析してみたいと思います。
これらの社説に対して分析を行います。形態素解析には辞書をカスタマイズしていない「MeCab」を使い、分析にはフリーのテキストマイニングソフト「KH Coder」を使いました。
まず分析の対象とする単語を選別。前回と同様に、主要な単語を多次元尺度構成法と呼ばれる方法でカテゴリーに分類します。
これらの単語からコーディングを作り、各時期ごとの文単位での使用率を示したのが次の図と表です。
社説の全体的な傾向をつかむため、階層的クラスター分析を用いて、社説を4つのクラスターに分けてみました。それぞれのクラスターごとの特徴を示します。
(以下略)
何とこんな手法を使えるのね、と思いました。
- 2017-10-05 勉強を始める前に「戦略を立てること」がパフォーマンスを左右する 記事に曰く
実験では、クラスの半数の生徒たちに15分で行えるアンケート調査が配られました。この調査では、まず、生徒たちにこれから受けるテストでどのような成績を出したいかと、求める成績を得ることがどれほど自分にとって重要なのかを考えさせました。
次に、「テストではどのような問題が出されそうか」ということ、そして講義ノート・テストの実践的な問題・テキストを読むこと・講師の業務時間・ディスカッション・家庭教師など、15のリソースのうちいずれが勉強に使えそうかを考えさせます。このとき、リソースを選んだ理由と、どのようにリソースを使うのかも答えさせた上で、効率的な勉強プランを立てさせたとのこと。
- 2017-09-28 AIにパスワードを推測させることでパスワード突破が容易になる可能性 記事に曰く
研究者らは「generator」と「discriminator」という2つのニューラルネットワークを用いるGenerative Adversarial Networks(GAN)を使用。GANにおいて、generatorは訓練データと似た人工的な画像を生成し、discriminatorは画像が訓練データなのかgeneratorが生成した画像なのかを識別します。これが繰り替えされることで、generatorはより訓練データに近い画像が作れるようになるわけです。
ってGANはうちの研究対象だったよねぇ、T君。
- 2017-09-24 PocketBeagle PocketBeagle is an ultra-tiny-yet-complete open-source USB-key-fob computer.
- 2017-08-20 python/matplotlibでgifアニメ
- 2017-08-18 Visual Studio 2017におけるPythonサポート 曰く
Visual Studio 2017(以下、VS 2017)でインストーラーの方式が変更されたことで、VS 2017でのPythonサポート機能は、従来のPython Tools for Visual Studioという形式ではなく、VS 2017の「ワークロード」という形でインストールされるようになった。本稿では、そのインストール方法とVS 2017のIDEとPythonがどのような形で統合されているかを見ていく。
- 2017-08-14 忘れないように 〜 大数の法則
- 2017-08-03 中国 「共産党無能」とAIが批判展開 サービス停止 記事に曰く
香港紙、明報は2日、中国のIT大手の騰訊(テンセント)が提供する人工知能(AI)を活用した対話プログラムがチャットで「共産党は無能」と批判を展開したため、サービスが急きょ停止されたと伝えた。
MSの時よりたちが悪い?
- 2017-07-26 係り受けとキーワード:重要語との関係
- 2017-07-08 グラフのコミュニティ検出(overlapped)
RにはLink CommunitiesもOverlapping Cluster Generatorもあるが、Pythonにはない?
- 2017-07-06 ML-Askでテキストの感情分析 日本語ができるっぽい。
- 感情の推定
2,100語の辞書によるパターンマッチングで{喜, 怒, 哀, 怖, 恥, 好, 厭, 昂, 安, 驚}の10種類の感情を推定します。この2,100語は、感情表現辞典に基づいているそうです。
- 感情の強さ
間投詞、擬態語、がさつな言葉、顔文字、「!」や「?」の数で感情の強さを推定します。
- ネガポジ分類
推定された感情から文を{ネガティブ、ポジティブ、ニュートラル}の3種類に分類します。
- 文脈の考慮
Contextual Valence Shifters (CVS) という概念に基づいて, 文脈を考慮した感情推定を行います. たとえば, 「好きとは言えない」という文の場合、「好き」が否定されているので、「好き」の逆の感情である「厭」だと推定します。
- 活性的かどうか
推定された感情を元に文が{ACTIVE, NEUTRAL, PASSIVE}であるかの分類します。たとえば、「昂」はACTIVEで、「哀」はPASSIVEです。
何か、欲しいもの揃ってる風。
- 2017-06-28 「Google for Jobs」を使って就活時間を節約しよう 求人情報だけのキューレーションらしい。アメリカのみか? 記事に曰く
デスクトップやスマホでGoogle Searchのページに行き、「自宅から近い仕事」あるいは「ITの仕事」と打ち込むと、検索にヒットしたあらゆる仕事が大量に出てきます。次に、いろいろな条件を入れて、検索をさらに絞り込んでいきます。
やってみたら、日本語で「自宅から近いITの仕事」とすると紹介サイトが多数出てくるが、具体的な求人が出てくるわけではないみたい。まだ、日本ではサービスしていないのかな。
- 2017-06-26 機械学習でGIGAZINEの関連記事を自動生成するサーバーを作ってみました 記事に曰く
大まかな仕組みとしてはGensimのDoc2Vecの機能を利用して関連記事を生成しています。現在ならfastTextを利用した方がラクにできるかもしれません。
このほかにも、自作サーバーの作り方(最近は簡易電源冗長があるとか)など、自分的には非常に波長の合う記事でした。
- 2017-06-23 言わば、ほんやくコンニャク+ボカロ。本人の声でリアルタイム翻訳・再生する音声技術「BabelOn」発表 記事に曰く
この音声合成の部分は基本的にはボーカロイドなどと同様、あらかじめその人の声を一定量サンプリングしたプロファイル情報BLIP(BabelOn Language Information Profile)を作成します。
本人の声で再生できるところがミソ。但し、記事に曰く
ただ、懸念されるのはこの音声合成技術を一般にまで広げて提供してしまうと、だれかがBLIPを盗み出せばたちどころに「完璧なオレオレ詐欺」が可能になってしまう可能性があること。また大統領クラスの人のプロファイルを作れば、サイバーテロリストがそれを盗み出し、電話での首脳会談に割り込んで勝手に宣戦布告したりすることも可能になりかねません。
- 2017-06-21 機械学習に“本物の芸術らしさ”を教育訓練できるか?、二人の学部学生がそんなGANに挑戦 記事に曰く
“難しいのは、成功の判定方法だ”、とJonesは語る。“そのための普遍的な測度はあまりない。
しかしとりあえずそのプロジェクトは成功し、JonesとBonafiliaは秋になったらソフトウェアエンジニアとしてFacebookに就職する予定だ。Bonafiliaの考えでは、もっと強力な計算機資源を使えたらプロジェクトの性能は大きくアップするだろう。Facebookには、強力なコンピューターがふんだんにあるはずだ。
- 2017-06-20 (英文)Sentiment Analysisのポインタ
- 2017-06-15 自分だけのAlexaが作れちゃう? Amazonのbotプラットフォーム「Amazon Lex」ためしてみた 記事に曰く
「人工無脳型botであれば「キーワードに合致する、発話パターンをたくさん作っていく…」というような設計方法が挙げられますが、自然言語系のbotは、ユーザーの発話をインテントに分類するところから、会話が始まります。」
更に記事の図中に曰く、
「ここに、このインテントに当てはまる発話サンプルを入力していきます。(この発話サンプル集をもとにAIが学習していき、曖昧なワードにも対応できます)」
この辺が面白そう。
ですので、まずはユーザーから予測されるインテント、つまり「ユーザーは、botに何を求めるだろう?」ということを洗い出す必要があります。
- 2017-06-15 Facebook、「交渉」できるAIチャットボットをオープンソースに 記事に曰く
Facebook Artificial Intelligence Research(FAIR)の研究者らは米国時間6月14日付けのブログ記事で、交渉ができる人工知能(AI)モデルを開発したことを明らかにした。これをダイアログエージェントと呼んでいる。FAIRは、約6カ月間にわたるプロジェクトの研究成果であるダイアログエージェントのオープンソースコードを公開するとともに、論文を発表している。
<ブログ記事>
<公開されたコード>
- 2017-06-14 顔いじりが定番になりつつある?
- 2017-06-14 線だけ描いたイラスト、AIが自動で色塗り 記事に曰く
線で描いたイラストに自然に色を付けてくれる人工知能(AI)が「PaintsChainer」だ。公式サイトで試せるほか、Preferred Networksが開発した機械学習ライブラリである「Chainer」上で動くプログラムや学習モデルを公開しており、パソコンでも動かせる。
- 2017-06-13 「OK Googleとは違う体験」--ハウスコムが「AI PET」に期待するコミュニケーション 記事の以下の文章が面白い
AI PETは、自身が飼っているペットの名前や性格、特長などを簡単な質問に応えて入力していくことで、性格づけをし、あたかもペットとチャットしてしゃべっているような感覚が味わえる無料のアプリ。現在登録できるのは猫と犬のみ。アイコンにはペットの顔写真を設定できる。
「特に難しかったのは、自然な会話にすること。AIチャットなどは質問をしたら、それに対する回答ができればいいが、今回目指したのはペットとの会話を楽しむこと。例えば『おはよう』と声をかけたら『おはよう』とあいさつで返してほしい。そうした気持ちの良いの受け答えができるように試行錯誤を重ねた」と話すのは、データセクションビジネス企画統括部長ビジネス企画部長 販売推進部長の伊與田孝志氏。人の会話同様に、柔らかい受け答えを目指したという。
AI PETには、3種類のエンジンを採用。1つは「おはよう」などの定型の問いかけに対して、定型で返してくれるエンジン。それに自由に会話する2つのエンジンを組み合わせた。そのうちの1つは、中部経済新聞が採用した文章自動生成AI「AI記者」にも採用されている、設定したキーワードを使って文章を組み立てるもの。もう1つがディープラーニングになる。
「最初はディープラーニングだけを使っていたが、求めている文脈に対して、返答があっているのかいないのかわからないことがあった。そこで人間の言っていることに対して、フィットするように、意図的に寄せていかないと気持ちの良い会話にならないということがわかり、2つのエンジンを加えた」と伊與田氏は説明する。
「そもそもペットは話さないので、この返答で正解かと聞かれても主観的なジャッジになってしまう。質問に対する正解を答えるAIと違いそこが難しい。そのあたりはデータを蓄積しながら高めていきたい」とビットエーCMOの中村健太氏は現状を分析する。
- 2017-06-12 パソコンで動くAI、白黒写真を自然な色合いのカラー写真に 記事に曰く
白黒とカラー写真の組み合わせを学習させた結果を基に色合いを“想像”してくれるのが、早稲田大学の石川博教授らが開発した自動カラー化のAI技術だ。公式サイトで試せるほか、自分のパソコンにインストールして動かせる。
- 2017-06-09 ネット中を駆け回っているニュース。孫さんがんばる?それともGoogleがBoston Dynamicsを見限った?
- 2017-06-01 Wikipedia日英京都関連文書対訳コーパス NICTから提供されているみたいです。曰く
- 人手翻訳による約50万文対
- 京都に関する内容を中心に、日本の伝統文化、宗教、歴史等の分野をカバー
- 本コーパスに含まれる日英対訳用語約5万語対を収録した『日英京都関連対訳用語集』が付属しています
- 2017-05-19 Chainer AE備忘メモ
- 2017-05-17 Similarity とか analogy とか
- 2017-05-04 Using the API
>>> import time
>>> from google.cloud import speech
>>> client = speech.Client()
>>> sample = client.sample(source_uri='gs://my-bucket/recording.flac',
... encoding=speech.Encoding.LINEAR16, # <-- 変わっている
... sample_rate_hertz=44100) # <-- 変わっている
>>> operation = sample.long_running_recognize( # <-- long_running_recog利用
... language_code='en-US',
... max_alternatives=2,
... )
>>> retry_count = 100
>>> while retry_count > 0 and not operation.complete:
... retry_count -= 1
... time.sleep(10)
... operation.poll() # API call
>>> operation.complete
True
>>> for result in operation.results:
... for alternative in result.alternatives:
... print('=' * 20)
... print(alternative.transcript)
... print(alternative.confidence)
- 2017-05-03 Ladder Network ?
- 2017-05-03 Energy-Based Learning
- 2017-04-30 Wordnetによる語のsimilarity議論
- 個人備忘 openVPN, Hamachi, SoftEther
- Google Magentaが新たに公開した2つの作曲ニューラルネットワーク(Lookback RNN,Attention RNN) 記事に曰く
先月2016年6月上旬にディープラーニングによって美術や音楽を生成することを目的としたプロジェクトMagentaは、第1弾としてBasic RNNを公開しました。この時点で、機械学習で作曲することに対する問題点がありました。このBasic RNNで生成された曲は、部分部分で聞くと、キーはバラバラでないし、一応音楽っぽいものにはなりましたが、コード進行はよくわからないし、曲の展開も変だし、メロディのつながりも微妙でした。
実は、長く続く構造(音楽でいうコード進行や曲の展開)は機械学習でとらえることはなかなか難しいのです。一方で人間はたやすくとらえています。今回新しく公開したLookback RNNとAttention RNNはBasic RNNよりこの長く続く構造を学習し生成しようと試みたものです。
- 2017-04-18 Chainerでchatbot
比較的わかりそうなプレゼンを追加 Semi-supervised Learning with Deep Generative Models(Yusuke Iwasawa)
Deep Learning Lecture 14: Karol Gregor on Variational Autoencoders and Image Generation
- 2017-04-05 アドビが新フォント「源ノ明朝」を無償配布 日本語、簡体/繁体中国語、韓国語に7パターンの太さで完全対応 記事に曰く:書体の開発にはアドビとGoogleが共同で取り組み、日本語はイワタ、中国語はChangzhou SinoType、韓国語はSandoll Communicationがパートナーとして参加。SandollのCEO・Geumho Seokさんは同フォントについて、「これは、複数言語を取り扱うデザイナーにとっては重要なリリースです。これらのフォントによって、Unicode でテキストを表示したときに『文字化けが発生しない(空白の四角形(□)が表示されない)』という目標が達成されます」とコメントしています。
- 2017-04-03 日本IBM、Watsonベースの「チャットボット」日本語版を投入 記事に曰く
Workplace Support Services with Watsonは、「チャットボット」機能を提供するサービス。あらかじめQA集を蓄積しておけば、チャットなどでの質問に対し、自動で回答を返す。やり取りを繰り返すことで、回答精度を高めることも可能だ。
- 2017-03-29 Googleが同社のオープンソースプロジェクトをすべて一箇所にまとめたサイトをオープン、関連ドキュメントも充実 記事に曰く
Googleが今日(米国時間3/28)、同社のオープンソースプロジェクトをすべて一箇所にまとめたサイトを立ち上げる。
これらのプロジェクトのコードは今後もGitHubと、Google自身がホストしているgitサービス上にあるが、この新しいサイトの機能はそれらのための中央的ディレクトリ(目録)だ。しかもGoogleのプロジェクトを陳列するだけでなく、Googleがソースコードをオープンにする場合のGoogle独自の“やり方”を開示することも目的だ、という。
- 2017-03-29 東大新卒が入社する50人以下の中小企業は何が違うのか
この種の話はもっと大きな声で騒いでほしいなぁ。
小回りの利く小さな企業、やる気、「おもしろい」、
長期のアルバイトやインターンシップでの採用(学生側からも企業選択)、
どれも≪あるべき≫姿だと思うんだが。
1つ気に入らないのは、メジャーが「東大卒」だということ。これはある確率では当たるが
必ずしもそうでもない(≪はず≫だし、≪そうであるべき≫)。
- 2017-03-28 Python Fire 曰く
Python FireはPythonコードに対するコマンドラインインタフェースを自動生成するライブラリ。グーグルがオープンソースプロダクトとして公開している。
- 2017-03-21 人工知能は「常識」を持てるのか--FacebookのAI研究者が語る 記事に曰く
人によって備えている常識の程度には差があるかもしれないが、「常識」とは(曖昧な概念ではあるにせよ)、込み入った状況において、明確な情報に頼るのではなく、自分自身の経験と世界観に基づいて公平かつ正当な判断を下す、という概念のことである。AIはこのことに苦戦している。
このような直観は人間らしい概念だが、FacebookのAI研究グループ担当ディレクターのYann LeCun氏によると、ニューラルネットワークとマシンビジョンの飛躍的な進歩により、将来的に常識を備えたソフトウェアが登場する可能性があるという。
- 2017-03-20 WordPressにMarkdown
- 2017-03-15 社長は消える、スナックのママは生き残る」 曰く <クリエイティブワーク、創造的な仕事以外に、もうひとつ、人間じゃないとできない仕事ってあるんです。それは、「人づきあい」。ヒューマンタッチな仕事は、むしろこれから大きな価値を持つようになります。たとえば、保険の外交員のお仕事。>
- 2017-03-14 MarkdownによるCMS
- 2017-03-02 「情報処理学会公式LINEスタンプ」一部イラストを配布開始
このたび、LINE の公式オンライストア「LINE STORE」に情報処理学会公式LINE スタンプ#include < 情報系技術者の日常.h> をリリースいたしました(プレスリリースはこちら)。このスタンプの一部のイラストを、LINE 以外でも画像ファイルとして使用していただけるように無料でダウンロードできるようにいたします。ぜひダウンロードして研究発表や資料作成などにご利用ください。
誰だ? こんなもん始めたやつは?
- 2017-02-22 人工知能Watson、「家庭教師」になる。 2016年10月25日、世界最大の出版社であるピアソンは、同社の教育デジタル・ソリューションにWatsonのコグニティブ機能を導入することを発表しました。ピアソンのサービスは、1300万人を超える大学生にグローバルな学習コンテンツを提供するもので、Watsonはオンライン学習コースのデジタル・チューター(家庭教師)の役割を担います。
- 2017-01-31 LUIS(自然言語解析サービス)
LUIS(Language Understanding Intelligent Services)はマイクロソフトがCognitive Servicesの一部として提供する自然言語解析サービス。LUISでは自然言語を理解するためのモデル(LUISアプリ)を開発者が構築し、それを基にLUIS自身が学習を積んでいくことで、ユーザーが「何をしたいのか」(インテント、意図)と関連する情報(エンティティ)を取り出せるようになる。
- 2017-01-17 うーむ、やられてしまったかな。 みずほ銀でロボット3体が…漫才風に資産運用を案内
みずほ銀行は、16日から期間限定でロボット3体による接客を始めました。3体が漫才の「ボケ」や「ツッコミ」を交えながら資産運用の説明をしてくれます。
ボケと突っ込みは、(学習には限定しないで)人工知能でやりたいことの1つだった。もし本気で作られているなら、先を越された。でも、あまり本気っぽくは見えないが。
- 2017-01-13 ちょっとログ。あまりに大量のファイルがあるためにlsすらできないとき。