投稿日:

周囲雑音抑制需要の高まりを受けスマートノイズ抑制技術を擁するKrispが5.3億円を調達

周囲の音を消し通話音声だけを分離するKrispのスマートノイズ抑制技術は、絶好のタイミングで登場した。同社は、世界で進むバーチャル化の波に乗り、初期のニッチな需要を実際の顧客需要へと転換し、その時期を得た技術の拡大と多様化を目指して、新規にラウンドAの輝かしい500万ドル(約5億3000万円)の資金を手にした。

私たちが初めてKrispに出会ったのは、同社がUC BerkeleyのSkydeckアクセラレータープログラムから登場(未訳記事)した、2018年のこと(未訳記事)だった。同社はAIスタートアップが急増し始めた時期の初期のものの1つだったが、明快なユースケースと明らかに効果的なテクノロジーを持っていたために、懐疑的に思われることはなかった。

Krispは、人間の声とそうでないものを区別するように訓練された機械学習システムを、リアルタイムで音声に適用する。音声ではないものは、スピーチの中から注意深く取り除かれ、残った音声がより明瞭に聞こえる。それがすべてなのだ!遅延はほとんどなく(15ミリ秒だと宣伝されている)、計算上のオーバーヘッドが少ないため、ほとんどすべてのデバイス、特に最新のスマートフォンのようなAIアクセラレーションユニットを備えたデバイスで動作させることが可能だ。

同社は、スタンドアロンのソフトウェアを無料で提供することから始め、時間制限をなくした有償プランを提供している。また、人気のソーシャルチャットアプリのDiscordにも統合されて出荷された。しかし、当然のことながら、実際のビジネスは企業向けのものだ。

「初期段階では、収益はみなプロフェッショナルたちからのものでしたが、昨年の12月に企業への売り込みを開始しました。新型コロナウィルスはその計画を本当に加速させることになりました」と語るのは、Krispの共同創業者でCEOのDavit Baghdasaryan(ダビット・バグダサリアン)氏だ。「3月の私たちの最大の顧客は、2000人の従業員を抱える大規模なテクノロジー企業でした。そして全員がリモートワークになったため、彼らは2000ライセンスを購入してくれました。銀行やコールセンターなどへの導入を進めているので、徐々に企業による採用が増えています。それでも、誰もがそれを必要としてくれているのですから、Krispは依然として消費者ファースト企業だと考えています、それで良いですよね?」

現在、さらに多くの大企業が契約している。その中には4万人を超える従業員を抱えるコールセンターもある。バグダサリアン氏によれば、同社は1年で有料顧客を0社から600社へ、経常収益を0ドルから400万ドル(約4億2000万円)に引き上げた。おそらく投資家たち(Storm Ventures 、Sierra Ventures、TechNexus、Hive Ventures)にとって、極めて安全な投資先に見えていることだろう。

これは、米国とアルメニアに分かれているKrispチームにとって、大いなる勝利である。アルメニアは同社創業の地であり、グローバルな人材調達アプローチの有効性を実証している。世界的な才能は、カリフォルニア、ニューヨーク、ベルリンといったテクノロジー中心地だけで見つかるわけではない。地元で投資インフラのメリットを享受できない小さな国にも見つかるのだ。

もちろん資金調達は別の話だが、資金を調達した同社は、現在製品とチームの拡大に取り組んでいる。Krispの次の取り組みは、基本的に会話のメタデータをモニターして提示することだ。

「次の開発サイクルでは、ノイズへの対処だけでなく、話者としてのパフォーマンスに関するリアルタイムのフィードバックも得られることになります」と、バグダサリアン氏は説明した。特に司会者としてというわけではなくとも、これまである通話の中で自分がどれくらい喋ったのかとか、あるいは他者にどれくらい割り込んだり割り込まれたりしたのかを、疑問に思ったことはないだろうか?

「話すことは改善可能なスキルです。音声と動画向けのGrammar.ly(英文添削アプリ)を想像してみて下さい」とバグダサリアン氏は強調した。「それがフィードバックを与える方法は精妙なやり方になるでしょう。話している最中に、その場でそれを見る必要はないでしょう。しかし、時間の経過とともに、私たちは話者が話すことを分析し、語彙についてのヒントや、スピーキング能力を向上させる方法を提供します」。

構造上、Krispは出入りするすべての音声に関与しているため、データを収集するのは簡単だ。だが心配する必要はない、同社の他の製品と同様に、処理はすべてプライベートに行われデバイスの上に閉じている。クラウドは必要ないのだ。

「私たちはこの点に強くこだわっています。私たちはデータを決してサーバーに送信しない会社です」とバグダサリアン氏は語る。「私たちがデータに触れることはありません。音声がデバイスの外に出なくても良いように、テクノロジーを開発して最適化するために、さらなる努力を重ねます」。

これは、会話全体を会話を分析するためにサードパーティへ送信することに疑念を抱く、プライバシーオタクたちを安心させることができるだろう。しかし結局のところ、Krispが提供しようとしているアドバイスは、発言の内容を実際に「理解」しなくても実行できるため、その範囲も制限可能だ。それはあなたを現代のキケロ(ローマの政治家、弁論家として有名)にしてはくれないだろうが、より一貫して喋るための手助けをしたり、喋りすぎかどうかを教えてくれたりはするだろう。

ただし当面の間、Krispはノイズ抑制ソフトウェアの改善に引き続き注力していく予定だ。ソフトウェアはここから無料でダウンロードできる。
画像クレジット: Bryce Durbin / TechCrunch

原文へ]

(翻訳:sako)

投稿日:

米国障害者法は施行30周年を迎えるが、テック業界のアクセシビリティ対応はまだ始まったばかり

Americans with Disabilities Act of 1990(1990年障害のあるアメリカ人法)が制定されて以来、数十年にわたり、建物、企業、法律は、さまざまな障害を持つ人たちに合わせて、徐々に変化を遂げてきた。今週で施行30周年を迎える同法がテック業界に与えてきた影響は極めて大きいが、やるべきことはまだ山積みだ。

ADAは施行当初、主に、建物や政府資源(公共サービス)に適用されていたが、時の経過とともに(改善や改正が施され)その適用範囲はかなり広範囲に拡大された。家庭用コンピュータ、ウェブ、そしてアプリが普及するにつれ、これらもADAの対象となったが、どの程度まで適用するかについてはまだ議論が続いている。

この記事では、テック業界が障害者の生活をどのように改善してきたか、現時点で何が不足しているか、という点について、いくつかの有名企業や障害者擁護団体に意見を尋ねた。

回答の内容を見ると、テック企業が障害者の生活にどのくらい貢献してきたか、という話題がやはり最も多かったが、同時に、最近ようやく製品開発プロセスに何らかの意味ある形で障害者を加えるようになった(が、まだ多くの点で十分とは言えない)テック業界に対する提言(とご批判)も頂いた。

Claire Stanley(クレア・スタンリー)氏、米国視覚障害者協議会、擁護/支援活動スペシャリスト

「テック企業は本当に多くの扉を開けてくれた」とスタンリー氏は言う。「例えば書籍。視覚障害者用の書籍を手に入れたい場合、10年前であれば、米国議会図書館が音声に変換してくれるまで待たなければならなかった。今は、Kindleや電子書籍リーダーがあるので、発売と同時に購入できる。以前より格段に早く手に入るようになった」。

「視覚障害者が職場でできることも増えた。ただ、アクセシビリティテクノロジーの使用を前提に設計されていないソフトウェアも数多く存在する、という点は指摘しておきたい。最初からスクリーンリーダーの使用を念頭に置いて設計してくれると大変助かるが、そうでない場合、別の新しい問題が起こる」とスタンリー氏は言う。

「テック企業はアクセシビリティなど念頭にない。だから、スクリーンリーダーがまったく使えない製品を設計する。私の理解では、最初からスクリーンリーダーを念頭に置いて設計すれば、互換性を持たせるのは簡単なはずだ。WCAGというガイドラインがある。プログラマーなら、このガイドラインをざっと眺めるだけで、『なるほど。わかった』となるはずだ。それに、よく聞く話だが、視覚障害者が使える製品を作れば、それは健常者にとっても優れた製品になる」とスタンリー氏は付け加えた。

まさにこの問題を緩和しようとしたのがFable(フェイブル)だ。フェイブルは、QAプロセスでアクセシビリティ対応についてテストすることを事前に考えていなかった企業のソフトウェアテスト担当者を対象に、さまざまな障害を持つ人たちの声をサービスとして提供している。

関連記事:障がい者が開発段階から参加して使いやすい製品デザインを目指すFableプラットフォームとは?

新しく登場した各種デバイスやサービスも視覚障害者の世界を一変させている。

「音声読み上げソフトを使う人が増えているため、点字を読める人は少なくなっているが、新しい設計の点字リーダーが登場しており、価格も安くなっている。私も自分の点字リーダーをいつも持ち歩いている」とスタンリー氏は言う。

もちろん、視聴覚障害者にとって、点字は今でも欠かせないものだ。最近、ある父親が娘に点字を教えようとして、自力で安価な点字教育デバイスを作ったという例もある。20年前には決してできなかった話だ。

「4年前にはAira(アイラ)というアプリが発売された。基本的には、スマートフォンの動画画面を介して、電話の相手が質問に答えて、必要なことを教えてくれるという仕組みだ。私も日頃から使っている。最近のバージョンではAIが組み込まれ、標識を読むといった簡単なことならAIが対応してくれるようになった」とスタンリー氏は言う。

「私たちは自律走行車の分野についても精力的に取り組んできた。自律走行車が実用化されれば、視覚障害者だけでなく、他の障害を持つ人たち、高齢者や子どもにも、多くの可能性が開けるだろう。実用化にはまだ時間がかかることはわかっているが、幸いにも、企業の担当者や議員と実際に会って、自律走行車のアクセシビリティについて話し合う機会を持つことができている」と同氏は付け加えた。

Eve Andersson(イブ・アンダーソン)氏、Google(グーグル)、アクセシビリティ担当取締役

「私が最も注目すべきだと感じているのは、キャプション技術の進歩だ。私がグーグルに入社してから2年後の2009年に、グーグルではAIを使ってYouTube(ユーチューブ)上で自動キャプション機能を導入した。その8年後には、音響効果(笑い、音楽、拍手など)をキャプションする機能を導入して、動画コンテンツをより視聴しやすくした」とアンダーソン氏は言う。

同氏によると、キャプションは当初、聴覚障害者や難聴者のアクセシビリティを実現するために開発されたものだが、音声をオフにした状態や他の言語で動画を観たいという多くの健常者の間でもすぐに利用されるようになったという。

「言語を理解して表示または翻訳できるようにコンピュータをプログラミングすることにより、あらゆる人に役立つさまざまな技術を進歩させることができる。例えば、音声認識や音声アシスタントにより、現在利用されている音声テキスト変換機能(Google Docsの音声入力機能やChrome OSの書き取り機能など)が実現した」と同氏は語る。

ライブの文字起こし機能もテック企業が開発した技術の1つだ。この機能により、聴覚障害者は相手とその場で直接会話できるようになった。

「ADAが施行される前は、物理世界の中に視覚障害者や弱視者がアクセスできない部分が残されていた。しかし現在、米国では、ほぼすべての標識の下に点字が表示されている。おかげで、Google BrailleBackTalkBack点字キーボードなどの製品を開発する道が開けた。どちらも点字ユーザーが必要な情報を入手し、周囲の世界と効率的にコミュニケーションすることを可能にする。『物理世界を障害者がアクセスできるものにする』というADAの精神のおかげで、イノベーションが促進されている。例えば、Lookoutというアプリを使えば、視覚障害者は自分の周りに何があるのかを知ることができる」とアンダーソン氏は言う。

「最近グーグルが検討している領域の1つに、テクノロジーを活用して認識障害者にやさしいものを作るという分野がある。これはさまざまなニーズがある本当に広い分野だが、ほとんど未開拓のままだ」と同氏は言う。Androidの「アクションブロック」はこの分野の初期の試みで、複数の手順からなるプロセスを1つのボタンで簡単に実行できるようにするものだ。アクションブロックの開発チームは、スマート機器を使いこなすのに苦労している人たちに役立つような機能にするために、大規模な改良を予定している。

「従業員、コンサルタント、ユーザーの中で障害を持つ方々に、製品の開発プロセス、研究分野やイニシアチブに常に最初から参加してもらえるよう、業界として取り組む必要がある。障害者や、家族に障害者がいる方々にチームに加わってもらうことで、その体験を開発の場に持ち込んでもらい、結果としてより良い製品ができるようにしたい」と同氏は語る。

Sarah Herrlinger(サラ・ヘリンガー)氏、Apple(アップル)、グローバルアクセシビリティポリシー担当ディレクター

「アクセシビリティは基本的に文化の問題だ。アップルは創業当初から、アクセシビリティ機能を人権と考え、この基本理念は現在でもアップルが設計するすべてのものにおいて明白に実践されている」とヘリンガー氏は語る。

月並みな声明に聞こえるかもしれないが、アップルの歴史はこの声明が実践されてきたことを証明している。アップルが他社に先立つこと数十年前からアクセシビリティ機能の開発に取り組んできたことはよく知られている。TechCrunchのコラムニストSteve Aquino(スティーブ・アキノ)氏は数年にわたり、アップルのアクセシビリティ機能への取り組みについて取材してきた。概要をわかりやすくまとめたのがこちらの記事だ。

Image Credits: Apple

発売当初からアップルの主力製品となっているiPhoneは、アクセシビリティを実現するメインプラットフォームでもある。

「主流の消費者向け製品としてのiPhoneがもたらした歴史的影響について書かれた記事はよく目にする。しかし、iPhoneとその他のアップル製品が障害者の人生を一変させてきたということはあまり理解されていない。iPhoneは、時と共に、最もパワフルで人気のあるアシスタントデバイスとなった。iPhoneは、あらゆる人が日常的に使うデバイスにアクセシビリティをシームレスに組み込むことができることを示したという意味で、従来の枠にはまった考え方を打ち破った」とヘリンガー氏は言う。

最も多くの人が助けられている機能はおそらくVoiceOverだろう。VoiceOverは画面の内容をインテリジェントに読み上げて、視覚障害者のユーザーがOSを簡単に操作できるようにするものだ。最近、VoiceOverのユーザーが自身の体験を投稿して、数百万ビューを獲得している。

一方、テック業界に不足している部分について、ヘリンガー氏は次のように説明してくれた。「レプリゼンテーション(自分が社会の構成員として認識されている状態や感覚)とインクルージョンは必要不可欠だ。アップルは、障害者コミュニティでよく言われる『Nothing about us without us(私たち抜きに私たちのことを決めるな)』というスローガンが真実だと確信している。アップルはアクセシビリティ専任チームを1985年に設置したが、インクルージョンに関するすべてのことがそうであるように、アップルではアクセシビリティもすべての社員の仕事だ」。

Melissa Malzkuhn(メリッサ・マルツクーン)氏、Gallaudet University(ギャローデット大)

Motion Light Lab(モーションライトラボ)創業者兼クリエイティブディレクター
「アクセシビリティを保護する法律がなければ、誰もそれを実装しようとしないだろう」とマルツクーン氏は率直に語る。「ADAはアクセシビリティの推進に大いに役立ったが、同時に、人々の考え方や社会的責任のとらえ方も大きく変わった。ソーシャルメディアでは、自分の投稿のアクセシビリティを向上させることは社会的責任であると認識する人が増えている。すべての個人、さらには、大小問わずすべての企業が、社会的責任を果たすようになることを願う」と同氏は言う。

ギャローデット大学は、「聴覚障害者と難聴者にとってのバリアフリー」を目指して、聴覚障害者・難聴者コミュニティ向けに膨大なリソースと教育を提供している。同大学の職員が長年使用してきたテクノロジーの多くは大きく進歩している。多くの主流ユーザーたちがビデオ会議の類いをこぞって利用するようになり、聴覚障害者向けの機能に改善の余地があると感じたためだ。

「ビデオ会議ではかつてないほど多くのオプションが使えるようになっており、継続的に改良されている。また、ビデオリレーサービスの使い勝手も着実に向上している」とマルツクーン氏は説明する。同氏によると、音声テキスト変換も大きく進歩しており、実用化も本格的に行われている。例えば、ギャローデット大学のTechnology Access Program(テクノロジーアクセスプログラム)はGoogleのLive Transcribeと共同研究を進めてきた。

「言語マッピング処理や、ジェスチャーや手話の認識に関する初期の先駆的な研究にはワクワクする」とマルツクーン氏は付け加えた。ただ、ジェスチャーや手話の認識については実用化はまだ先の話だ。一方で、手話グローブに関するさまざまな試みについて、同氏は、「手話グローブにはうんざりしている。聴覚障害者にこれを着けさせればコミュニケーションの問題はなくなる、という一方的な考え方を助長するだけだ。コミュニケーションにかかる負荷を障害者側に一方的に押しつけても問題は解決しない」と、手厳しく批判する。

「AppleのiPadは聴覚障害を持つ子どもたちの読書体験に対する考え方に革命をもたらしたと言ってよいと思う。当学のモーションライトラボでは、手話による動画と文章を同じインターフェイスで操作できるバイリンガルのお話し本アプリを開発した。ただし、テクノロジーが、誰にもある思いやりの心に取って代わることは決してない。必要なのは、テクノロジーの有無に関係なくコミュニケーションしたいという姿勢があるかどうかだ。少し手話を覚えるだけでもコミュニケーションに大いに役立つ」と、マルツクーン氏は語る。

また、マルツクーン氏はインクルージョンの価値を強調し、聴覚障害者の雇用や対応にまったく手つかずの状態の企業を手厳しく批判した。

「聴覚障害者を雇用している企業は正しく理解している。インクルーシブな設計とアクセシビリティは重要かつ製品設計に『不可欠』なものと考えて注力している企業も、正しく理解している。そのような企業の製品は例外なく、アクセシビリティの低い製品より優れている」と同氏は語り、アクセシビリティの低い製品を作る企業は『深刻な不作為』という罪を犯していると指摘する。「多くの企業が聴覚障害者の助けになる製品を作ろうとしているが、開発の初期段階から聴覚障害者が参加していなければ、障害者にとって良いものはできない。インクルーシブな設計にはまずインクルーシブなチームが必要だ」と同氏は言う。

投資家もアクセシビリティと聴覚障害に取り組むスタートアップに目を向ける必要がある。成長中の聴覚障害コミュニティがそうであるように、聴覚障害に特化したスタートアップも資金と助言を必要としている。

また、マルツクーン氏は、企業が聴覚障害者や難聴者を、最終製品の消費者としてだけでなく、一人前のユーザーとして考えるようになってほしいと指摘する。

「これは私の仕事の原動力になっている。私たちは誰もがテクノロジーを設計できるように常にツールを提供する必要がある。そして、聴覚障害者にトレーニングと教育を施し、それらのツールを使えるようにする責任がある。そうすることにより、設計や構築が行えて、システムのアーキテクトとなり、システムをプログラミングすると同時にテクノロジーのエンドユーザーにもなれる、次世代の若い聴覚障害者たちを育成できる」とマルツクーン氏は語った。

Jenny Lay-Flurrie(ジェニー・レイフレリー)氏、Microsoft(マイクロソフト)、アクセシビリティ担当最高責任者

「個人的には、ADAによって、キャプショニングと通訳のテクノロジーが一段と高いレベルで認識され提供されるようになったと感じている。どちらも私にとって、職場でも家庭でも、そして医療など生きていく上で不可欠なサービスを受ける上でも欠かすことのできないテクノロジーだ。テクノロジーによって、ADAの精神の下、これまで不可能だったことを可能にする力を障害者に与えるソリューションを開発する道が開かれ、万人を益する素晴らしいイノベーションが生まれる。一大変革をもたらすには、まずアクセシビリティの向上に優先的に取り組む必要がある」とレイフレリー氏は語る。

グーグルのイブ・アンダーソン氏と同様、レイフレリー氏も、最近の大きな進歩としてキャプショニングに注目している。

「キャプショニングは、他のアクセシビリティ技術と同様、ますます日常生活に溶け込んでいる。キャプショニングは過去30年で大きく進化を遂げ、この5年間は、AIとMLのおかげで進化がさらに加速した。AIキャプショニングはTeamsにも統合されており、コロナ禍の最中、Teams Captioningの使用率が数か月前の30倍になるなど、その効果を目の当たりにしている」と同氏は言う。

「Seeing AI、Learning Tool、Xbox Adaptive Controllerなど、アクセシビリティ技術も多様化が進んでいる。マイクロソフトがインクルーシブな設計を重視するようになったためだ。上記の製品も障害者の協力を得て、障害者のために開発され、視覚障害、識字障害、運動障害のためのブレイクスルー技術も生まれている」と同氏は語る。

Adaptive Controllerは、ここ数年で最も驚かされたハードウェアの1つだ。これは、ゲームをプレーし、コンピュータとコンソールを操作するための極めて互換性の高いデバイスで、多大な努力と多額の投資が生み出した成果であることは間違いない。

アクセシビリティは「まだ閉じたままだが、何が何でも早急に開けなければならない扉」の1つだとレイフレリー氏は言う。「Seeing AIはAIの大きな可能性を示していると思うが、今後、AIとML、およびARmによって、身体障害の分野で広く何ができるようになるのか、今後が楽しみだ。マイクロソフトは、障害者が直面している最大の課題のいくつかをAIによって解決できると確信している。AI for Accessibilityプログラムが、インクルージョン改革を推進するためのマイクロソフトの取り組みで重要な役割を果たしている理由もそこにある」と同氏は続ける。

レイフレリー氏は、インクルーシブ性を会社のプロセスに組み込む方法についても話してくれた。マイクロソフトがこの問題に関してリーダー的役割を果たしてきたことを考えれば、当然のことだ。

「アクセシビリティを避けて通ることはできない。それは、ビジネスとエコシステムに組み込まれていなければならず、管理と調整を必要とする。アクセシビリティを実現するにはまず人だ。我々は、インクルーシブな文化と人材のパイプラインをどのように創り上げるかに注力してきた。まだ成長と学習を続けている段階だが、Autism Hiring Playbook(自閉症を持つ人材の採用ガイド)、Accessibility at a Glance(アクセシビリティ早わかり)トレーニングリソース、Supported Employment Program Toolkit(援助付き雇用プログラムツールキット)、Inclusive Design Toolkit(インクルーシブ設計ツールキット)といったリソースを介して学習した内容を、他の組織と共有するという対策も講じてきた」と同氏は言う。

「当然だが、どこから始めて、どのようなペースで進めるのかは組織によって異なる。まずは、アクセシビリティを設計に組み込む必要性を認識することが第一歩だ。アクセシビリティというレンズを通して製品開発のライフサイクルの成熟度を評価し、障害者支援機能を後付けで追加するのではなくプロセスに最初から組み込むようにすることが特に重要だ。ここでやるべきことはまだある。それが完了するまでは、『アクセシビリティが確保されているかどうか判断に迷う場合は、確保されていないということだ』というのが私のモットーだ」とレイフレリー氏は語った。

Mike Shebanek(マイク・シェバネク)氏、Facebook(フェイスブック)、アクセシビリティ担当部長

「スマートフォンの可搬性、使いやすさ、値ごろ感、組み込みのアクセシビリティのおかげで、障害者の接続性、モビリティ、自立性は今、30年前は誰も可能と思わなかったレベルまで向上している。デバイスの音声合成、音声認識、音声制御などの音声テクノロジーが登場したことで、障害者の生活の質は格段に改善された」とシェバネク氏は言う。

「フェイスブックはReact Nativeを開発し、オープンソースにすることで、デベロッパーがアクセシビリティ対応のモバイルアプリを作成できるようにした。また、ウェブアクセシビリティのグローバルなデジタル規格を策定して、すべての人がアクセシビリティの高いインターネット体験を得られるようにした」と同氏は続ける。

他の回答者と同じように、シェバネク氏もテック企業は開発の初期段階からアクセシビリティのニーズと手法を検討する必要があること、開発プロセスとテストプロセスに参加させる障害者の数を増やすことを提案する。

機械学習はいくつかの大きな問題を自動的に解決するのに役立っている。「フェイスブックではMLを使って自動動画キャプショニングを実行し、代替テキストを自動作成して、視覚障害者向けに音声による写真の説明を提供している。しかし、これらのイノベーションが実現されたのはごく最近のことだ。テック業界は今やっと、障害者のニーズに真剣に向き合い始め、これから30年で実現できそうなサービスの、ほんのさわりを形にし始めたところだ」とシェバネク氏は語る。

関連記事:Androidに点字キーボードが標準搭載、5.0 Lollipop以降が対応

カテゴリー:パブリック / ダイバーシティ

タグ:アクセシビリティ

[原文へ]

(翻訳:Dragonfly)

投稿日:

YouTubeが中国の多数のアカウントを「政治的スパム」として削除

YouTubeは中国のアカウント多数を組織的な政治的影響力の行使に従事していたとして削除した。この4月から6月の四半期における中国アカウントの削除は2596件と急増している。2020年の最初の四半期の削除は227件(Googleブログ記事)だった。

Googleは脅威分析の速報である「TAG Bulletin: Q2 2020」(Googleブログ記事)で、第2四半期の状況を「削除されたチャンネルがアップロードしていたのは主として非政治的コンテンツだったが、一部のコンテンツが中国の政治に関連していた。内容はGraphikaが最近レポートしているものに似ており、新型コロナウイルスが中国で発生したものでないなど、中国側主張に対する米国の反論に関連したものも含まれていた」と述べている。

Graphikaの「スパモフラージュ・ドラゴンの復活:中国擁護スパムネットワーク再び仕掛ける」と題したレポートはこちらで読める。それによれば中国の世界的なプロパガンダ攻勢の一環として今年の初め頃から多数のスパムアカウントがYouTube、Facebook、Twitterなどのソーシャルメディア上で活動を始めていたという。

スパムネットワークは中国政府を擁護するチャンネルでビデオ画像を大量に使っていた。また中国語、英語の双方で長文の非政治的記事を掲載していた。バスケットの試合や風景、モデル画像、TikTok動画など無害な非政治的コンテンツの間に政治的記事が埋め込まれていた。つまり政治的スパムをカモフラージュしようと意図した行動と考えられる。そこで「スパモフラージュ」と名付けた。

このスパムドラゴンの活動が「復活」と名付けられた理由は昨年の秋にも同様のスパム行為があったからだ。黒幕が誰であるにせよ、発見されても気にする様子はないようだ。利用されたアカウントは新規のものもあれば休眠アカウントを乗っ取ったり盗んだりしたものもあった。今回もこうしたアカウントを大量に使って前回によく似た手法のスパム活動に利用している。ただしグーグルが指摘するとおり今回はこれに新型コロナウイルス関連のスパムが加わっているのが新しい。

6月になると、スパムコンテンツにはGeorge Floyd(ジョージ・フロイド)氏とBreonna Taylor(ブリオナ・テイラー)氏の殺害に端を発した人種的不公正に対する抗議活動が米全土で盛んになったことが含まれるようになった。

中国のキャンペーンはロシアやイランのものと同様マルチプラットフォームだとグーグルは指摘している。これはFacebook Twitter、サイバーセキュリティ企業のFireEyeも報告していた。

チャンネルの削除は4月に186件だったのに対し、5月に1098件、6月に1312件と急増してきた。これからすると夏には大量のスパムの発生がありそうだ。注意して観察したい。

画像:Jaap Arriens/NurPhoto via Getty Images 

原文へ

(翻訳:滑川海彦@Facebook

投稿日:

米連邦通信委員会がSNSのコンテンツ免責をうたう第230条へのトランプ大統領の攻撃について市民にコメントを求める

【抄訳】
米連邦通信委員会(FCC)の委員長であるAjit Pai(アジット・パイ)氏は、現在のインターネット経済の創造に寄与したと思われるある種の保護を薄めようとするためにトランプ大統領が2020年5月に開始した計画に対して、それについての考えを、一般国民に求めることを決めた。露骨に報復的な命令は、法的には笑えるようなものであり、一般市民からの声がなくても解決する可能性があると思われるが、FCCはみんなの意見を求めており、それを伝えたほうがいいかもしれない。

コメントは長年使われてきた(未訳記事)FCCの電子的コメント提出システムで残すことができるが、ここで出すことができるが、その前にいくつかの事実を知っておいて欲しい。

問題の通信品位法第230条は、Facebook(フェイスブック)やGoogle(グーグル)のような企業が、彼らが単にホストしたにすぎないコンテンツに関して法的に有責になることを防ぐ。ただし、不法なコンテンツを迅速に削除したならば、という条件が付く。一部の人たちは、この保護があることによって企業にそのプラットフォーム上の発言を操作する機会を与えると感じている。トランプ大統領はメールによる投票について立証されていない主張をして、Twitter(ツイッター)に「事実確認」の警告を出され、自らが操作のターゲットになったと感じた。

命令そのものを理解し、また、その影響を受けてしまう企業やその法律を作成したオレゴン州選出民主党のRon Wyden(ロン・ワイデン)上院議員からのコメントを読みたい人は、トランプ大統領がその命令に署名した当日の記事(未訳記事)をお読みいただきたい。ワイデン氏はその命令を「明白に違法だ」といっている。

第230条の不備な部分を補うための超党派の取り組みについて知りたい人は、6月に発表されたPACT Act(プラットホームの責任と消費者の透明性に関する法)をチェック(未訳記事)しよう。この新しい法律の起草についてハワイ州選出民主党のBrian Schatz(ブライアン・シャッツ)上院議員は、「削岩機ではなく外科用メスを使った」と述べた。

関連記事:米連邦通信委員会の委員がSNS関連の大統領令を非難、我々の専権事項と主張

FCC側の状況についてわかりやすいのは、現職の委員であるBrendan Starks(ブレンダン・スタークス)氏のコメントだ。彼は命令の適法性と倫理を問題視し、命令は一部の企業を脅かすための個人的な復讐だと比喩的に語った。

【中略】

なお、パイ委員長が公衆コメントの期間について触れているメモの中で触れているのはスタークス委員のことだろう。パイ氏は「法の無視や公衆の排除を要求する人たちには合意できない。すべての利害関係者がこの重要な問題の論争に加わるべきだ。活発な議論は歓迎するが、議論の排除はノーだ」という。

これに対してスタークス委員は、この命令にはFCC自身が迅速かつ権威をもって対処すべきだ、と考えている。なぜならこのコメント投稿のような形式の陳情の法的有効性が疑われる可能性もあるからだ。FCCが自ら考えて、自ら判断すべきものを一般市民に判断させようとするのも問題だ、とスタークス氏は考えている。しかもFCCがコメントの結論的な大勢をどれだけ真剣に受け止めるのか、それとも無視するのか、その採否すらわからないのだ。

【後略】

画像クレジット:Mark Van Scyoc / Shutterstock

原文へ
(翻訳:iwatani、a.k.a. hiwa

投稿日:

楽天がRakuten USストアを閉鎖へ、2014年に買収したBuy.comが前身

楽天が、かつてBuy.comの名で知られていた米国のオンラインリテールストアを閉鎖し今後の2カ月で経営を縮小していくことをTechCrunchは確認した。

米国法の代表者はTechCrunch宛てのメールで「私たちは米国のRakuten Marketplaceを閉鎖することに決めました」と述べた。ただしRakuten.comが提供しているリファラル事業である「Cash Back Rewards」(お礼のキャッシュバック)は「絶対に閉鎖せず続けていく」ということだ。同事業は、同社が2014年に10億ドルで買収したEbates(未訳記事)がベースになっている。

楽天は2010年にBuy.comを2億5000万ドルで買収(未訳記事)し、リテール事業を本拠地である日本以外にも拡張することを試みた。しかしマーケットの進化と、ライバルを狙い撃ちするAmazon(アマゾン)の急激な成長、さらに知名度のあったブランドをRakutenの名前に変えたことなどにより、業績は下降した。Buy.comの元のCEOとCOOは2012年に去った。

Rakuten USのストアの顧客は、今後2カ月間は注文できるが、そのあとはサイトは完全に閉鎖される。キャッシュバックや、電子書籍リーダー「Kobo」の部門などのコミッション事業については大きな変化はない。

今回の閉鎖は楽天にとっては痛手だが、意外性はあまりない。同社は世界中の非常に多くの企業や事業分野に投資(未訳記事)しており、その中には暗号通貨(未訳記事)すらある。このようなマーケットプレースの失敗はレイオフされる側はは気の毒だが、現時点で同社の業績を大きく左右するものではない。

関連記事:Rakuten has SoftBank in its sights(未訳)

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

投稿日:

障がい者が開発段階から参加して使いやすい製品デザインを目指すFableプラットフォームとは?

アクセシビリティは、その機能を持たずに仕上げられた製品に後付けするものではなく、開発の最初の段階から考慮すべきものだと、テック企業も気づき始めている。しかし、それのために必要なリソースを持つ企業は極めて少ない。Fable(フェイブル)は、障がい者も使いやすいインクルーシブな製品のデザインが楽に行えるよう、個々の障がい者の要求に応じた開発やテストの支援を目指している。同社はそれを実現するための、150万ドル(約1億5800万円)のシード投資を調達した。

「障害を体験している人は、みな最高の解決策の持ち主です」とFableの共同創設者Alwar Pillai(アルウォー・ピライ)氏はTechCrunchに話した。だが、それが製品のアクセシビリティ機能に活かされることは稀だ。

しかも、そうした製品を開発しているのは、健常者で40歳未満の人たちであることが非常に多いと彼女はいう。「そのため優先順位は低く、不完全なものになりがちです」とピライ氏。「大切なのは、この製品は目の不自由な人でも本当に使えるのか、と考えることではありません。企業が障がい者の意見を求めることです。Fableは開発とテストの最初の段階から障がい者に参加してもらうための、デジタルチームと障がい者とを結び付けるプラットフォームです」。

関連記事:どういうわけかTwitterにはアクセシビリティ専門チームがない

Fableは、製品開発で参考にしたい障害を持つ人に、オンデマンドでアクセスできる環境を提供する。プロトタイプやモックアップを協力者に送り、48時間使ってもらって評価を聞くこともできる。

「ほとんどの企業には膨大なデジタル製品がありますが、障がい者がそれをどう感じているかを把握していません。例えば目の見えない人は、サインアップの手続きに1時間もかかるということなどです」と共同創設者でCOOのAbid Virani(アビッド・ビラーニ)氏は話す。「そこで私たちは、いくつかのプロトタイプを、例えば四肢麻痺の人や、うんと拡大しなければよく見えない視覚障がい者の前に置き、彼らがどのように使うかを観察するのです。彼らは、思いもよらない事柄をフィードバックしてくれます」。

もちろん、顧客はターゲットとする障害、生活支援技術、プラットフォームを選んでテストできる。例えば視覚障がい者にモバイルブラウザーをテストして欲しい、といった具合だ。

モバイル画面リーダーのユーザー、多様なユーザーでChromeを、視覚障がい者にあらゆるデバイスを(画像クレジット:Fable)

この作業は開発中に、しかも開発を遅らせずに行うことが重要だと、ピライ氏とビラーニ氏はいう。さもなければ、それは開発の最終段階に持ち越されてしまい、実際に障がい者が使いやすいものを作ることよりも米国障がい者法に適合させることが目的になってしまうからだ。

「適合しているのに、まったく使えないサイトができ上がる恐れがあります」とビライ氏はいう。しかし多くの企業は、障がい者のテスターを抱えていないため、そのことに気づくことすらない。

また大規模な製品になると、様々な要素やプラグインやパートナーが統合されていて、そのエクスペリエンスにとって重要な部分であっても、それぞれアクセシブルであったり、なかったりするという問題がある。表面的にはアクセシブルなサイトに見えていたのに、いよいよ有料サービスの課金処理へ移行しようという段になってナビゲーションが急に難しくなるようでは、本当にアクセシブルとはいえない。

これでは大量の商機が無駄になっていると、ピライ氏は指摘する。「数十億ドル(数千億円)という可処分所得を持つ人たちがいますが、未開拓のままです。これは市場の好機なのです」と彼女はいう。ただし、最初からアクセシビリティを考慮したデザインをしていればの話だ。

それだけではない。パンデミックによって家で仕事をすることが多くなり、オフィスでは問題なく行えていたことが、リモートワーク用ツールでは難しくなる場合もある。

テストに協力できる障がい者を紹介し、障がい者に縁遠かった安定した仕事を提供するだけでなく、Fableは洗練されたテスト方法を公表(Adobeリリース)し、そこから得られたデータを利用した現状の改善も目指している。

今回の150万ドルの投資ラウンドは、カナダを拠点とするDisruption VenturesとシリコンバレーのVillage Globalが主導した。「私たちには公益のための仕事で10億ドル(数千億円)規模のビジネスを確立することが可能だと、信じてくれる人たちを求めていました」とビラーニ氏はいう。

米国障がい者法は昨日で施行30年目を迎えた。90年代からずいぶん時間が経ってはいるものの、やるべきことがまだ残されている上に、これからも続く仕事であることは明らかだ。開発とテストの基礎の段階にアクセシビリティとインクルージョンを組み込むことで、そのゴールが見えてくるに違いない。

画像クレジット:Fable

原文へ

(翻訳:金井哲夫)

投稿日:

コンピュータビジョン界のRaspberry Piとなる「OpenCV AI Kit」が新登場

新登場のガジェット「OpenCV AI Kit(OAK)」は、Raspberry Pi(ラズベリーパイ)や他の超小型コンピュータソリューションの成功に倣ってはいるが、成長著しいコンピュータビジョンや3D知覚の分野に特化しているという点で他とは異なっている。新しいマルチカメラ対応プリント基板により、小型でオープンソースのユニットの中に多数の機能を詰め込むことに成功したOAKが現在、Kickstarter(キックスターター)で出資者を募集中だ。

OAKでは、カメラとオンボードのAIチップを使って、物体認識、人数カウント、フレーム内にある複数の物体間の距離測定など、さまざまなコンピュータビジョンタスクを処理できる。そして、処理された情報は分かりやすく、すぐに使える形式で出力される。

OAKのように信頼性が高く、低コスト、低消費電力のコンピュータビジョンユニットは、もしOAKがなければ複数の個別カメラとチップが必要(付随するソフトウェアの設定も必要となることは言うまでもない)とされるスマート機器やロボットの開発者にとって、非常に心強い味方である。

Image Credits: Luxonis

ハードウェアにも少し手を出すホビープログラマーが必ず使うというラズベリーパイのように、この手のデバイスを構成するほぼすべての要素は二次利用に関する制約がないMITのフリーライセンスに基づくオープンソース仕様である。さらにOAKは、コンピュータビジョンの世界で広く使用されている数多くのライブラリや標準を公開しているOpenCVと正式に提携している。

実際のデバイスとオンボードAIは、以前にリアルタイムで物体の動きを追跡して乗り手に警告を発する二輪車用スマートブレーキライト「CommuteGuardian(コミュートガーディアン)」を開発したLuxonis(ルクソニス)によって開発された。自分たちのイメージにぴったり合うハードウェアがないことに気づいたルクソニスの開発チームが独自にハードウェアを開発し、その後続モデルとしてOpenCVと提携して開発したのが今回のOAKシリーズである。

実はOAKには、超小型モデルの「OAK-1」とトリプルカメラモデルの「OAK-D」の2種類がある。共通しているコンポーネントが多いが、OAK-Dにはマルチカメラユニットが搭載されているため、プレーンなRGB画像の他のキューに頼らずにステレオの立体画像を実現できる。RGB画像のキューを認識する技術もかつてなく進歩しているが、それでも、ステレオで立体視できることは大きな長所である(ちなみに人間の視覚システムでは両方使われている)。

Image Credits: Luxonis

OAKの目的は、コンピュータビジョンシステムを利用することによって、それをゼロから構築あるいは構成する必要をなくし、多くのプロジェクトがより迅速に発足できるようにすることだ。物体や奥行きの検出機能は既に組み込まれているのですぐに使うことができる。あるいは、任意のメタデータを選び、それを使って付属の4Kカメラ(および2つの720pカメラ)画像の分析を独自の方法で拡張することも可能だ。

消費電力が非常に少ないことも長所である。コンピュータビジョンタスクはプロセッサにかなりの負担がかかるため消費電力もかさむ。XNOR(エックスノア)の超低消費電力チップなどのデバイスが非常に有望視されているのはそのためだ(だからこそエックスノアはApple(アップル)に買収された)。OAK製品はエックスノアほど超低消費電力ではないが、それでも最大消費電力は数ワットであるため、処理するタスクによっては標準サイズのバッテリーでも数日あるいは数週間、充電なしで動く。

ポート、ケーブル、GitHubリポジトリなどの側面を熟知している人は間違いなく、OAKの仕様を興味深いと感じるだろう。詳細な仕様についてはクラウドファンディング用ページで分かりやすくまとめられているので、ここでは詳述しない。以下に要約版を記載する。

Image Credits: Luxonis

OAKシリーズの製品が自分のプロジェクトやラボで使えそうだと感じたら、ぜひ早めにキックスターターから申し込むことをおすすめする。早期特典として大幅割引が用意されており、小売価格の半分で手に入れることができるからだ。公表されている機能を考えると、OAK-1が79ドル(約8500円)、OAK-Dが129ドル(約1万4000円)という価格は、個人的には格安だと思う。最終的な小売価格はOAK-1が199ドル(約2万1000円)、OAK-Dが299ドル(約3万2000円)になる予定だ。さらに、ルクソニスとOpenCVは、新製品を発表しておきながら実際の発売がいつになるか分からないと言い出すようないい加減な組織ではないので、安心してクラウドファンディングのキャンペーンに参加できる。また、今回のキャンペーンでは、当初の目標額は開始後1時間で達成済みであるため、そのこともまったく心配する必要はない。

関連記事:自宅のシステムをアップグレードしてくれる、最強のWi-Fi 6ホームネットワーク

カテゴリー:ハードウェア

タグ:ガジェット カメラ OpenCV

[原文へ]

(翻訳:Dragonfly)

投稿日:

米宇宙軍が中央に北極星が輝く正式ロゴと標語を発表、配備された軍用馬も紹介

2020年に入っていろいろと揶揄されもしたが、実際のところ非常に重要な新しい軍種である米国宇宙軍が発足した(未訳記事)。その宇宙軍がこのほど「スタートレック」を連想させるシャープなイメージの公式ロゴを発表、またロゴに伴う標語も発表している。ラテン語で「Semper Supra」(センパースープラ)つまり「常に上に」といった意味だ。

実はロゴの候補画像は2020年1月に明らかになっていた。画像を見て多くの人は米国が宇宙艦隊を作るのかと思ったようだがそうではない。宇宙軍の主要な任務は宇宙空間の監視とモニターだが、新しい公式ロゴは組織の目的をよく表現している。ロゴは宇宙軍のブランドイメージとしてプレスリリースやリクルート活動にも使用される。

宇宙軍はツイートでロゴの各要素を説明(@SpaceForceDoD投稿)している。特に難解なものではないが、クールだからというだけなく、デザインにはそれぞれきちんと意味があるという。

画像クレジット:U.S. Space Force

周囲の銀色のラインが天空を指す全体の鋭いデルタ形は、宇宙からのあらゆる脅威から米国を防衛、保護することを表現しており、中央の星は不動の北極星だという。

星の周囲となる真ん中の黒い部分は「深宇宙の広大な闇」を表しており「恐怖を感じる人もいるが、我々はむしろ新しい挑戦として立ち向かう」とのことだ。

北極星は、北の空にあって人々を導くという意味がある。それがロゴの中心に置かれている理由だ。

星の周囲の4つの三角形は、宇宙軍をサポートする既存の4軍である空軍、陸軍、海軍、海兵隊を表現している。上方に向かって鋭く尖っているのは。宇宙に向かってロケットを発射するイメージなのだろう。

「常に上に」を意味する「センパースープラ」という公式標語だが、宇宙軍によって「守られている」と感じるか、「脅威が増大した」と考えるか、どちらの側にいるかによって印象は逆になる。標語は宇宙における米国の存在を「確立、維持、確保」することを表現している。もちろん地上の兵士にとっては、宇宙軍が常に頭上にいて戦術的支援を提供することは心強い。スパイ衛星や軌道レーザー兵器を考えるものもいるかもしれない。

宇宙軍は組織を確立し、新規採用を行う必要があるため今後数年間、このロゴと標語をあちこちで見かけることになるだろう。

もう1つ重要なことだが、宇宙軍には軍用馬もいる!

宇宙からの脅威から米国を守ることにはさまざまな側面があります。例えば軍用馬保存育成プログラムを実施する@30thSpaceWingで軍用馬が訓練されています。「ゴースト」は5歳の@BLMNationalのマスタングです。

新しいロゴと標語を得た宇宙軍と美しい軍用馬にお祝いをいっておこう。

画像クレジット:U.S. Space Force

原文へ

(翻訳:滑川海彦@Facebook

投稿日:

Twitterが30人以上の著名人アカウントDMにハッカーがアクセスしていたことを認める

先週の100を超える著名Twitterアカウントのハッキングは、そのうちの多くのアカウントのダイレクトメッセージを暴露していたことを、Twitterが米国時間7月22日に認めた。そこにはオランダの自由党初代党首であるヘルト・ウィルダース氏の名前もあった。

多くの有名人や政治家のアカウントが乗っ取られ、ツイートされたBitcoin(ビットコイン)詐欺はかなり見え透いた手口だったにもかかわらず、少なくとも10万ドル(約1070万円)の金額が送金されたと見られている。Twitterは「組織的ソーシャルエンジニアリング攻撃」によって、ハッカーは「内部のシステムおよびツール」のアクセスが可能だった」と語った。認証済みユーザーのアカウントは一時的にツイートが禁止された(一部で歓迎された処置だ)。

Twitterはこの「セキュリティー事象」に関するツイートとブログ投稿で、「ハッキングされた130アカウント中最大36アカウントで、アタッカーはDMの受信箱をアクセスした」と説明し、同社は影響を受けたアカウントの持ち主と「積極的に連絡をとっている」と話した。

Twitterは、DMがハッカーにアクセスされたかどうか、事件の直後には公表しなかった。Twitterのメッセージシステムは暗号化が十分でないことで悪名高いが、アタッカーが使用したとされている管理ツールによって受信箱のアクセスが可能になったかどうかは明らかではない。

関連記事:Twitterの暗号通貨詐欺の元凶は内部ツールに不正アクセスした一人のハッカー

どんな方法が用いられたにせよ、一定時間はDMのアクセスが可能だったようであり、乗っ取った残りの94アカウントについてはハッカーがチャンスを利用しなかっただけかもしれない。Twitterの発表からははっきりしない。以前Twitterは、ハッカーがパスワードをアクセスした「証拠はない」と発言しており、これを否定する最新情報はない。

Twitterは「ほかに現職、前職を問わず公選された公務員のDMがアクセスされた形跡はない」と話し、問題に明るい兆しがあることを伝えようとした。バラク・オバマ氏とジョー・バイデン氏のアカウントが被害にあっていることを踏まえると、それは厳密には良い知らせなのだろう。この気がかりなセキュリティー侵害に関してTwitterの発表を聞くのは、これが最後ではないことはほぼ間違いない。

画像クレジット:TechCrunch

[原文へ]

(翻訳:Nob Takahashi / facebook

投稿日:

米国立科学財団が量子コンピュータ研究に約80億円を助成へ

量子サイエンスは実用化に向けて最近スタートを切ったばかりだが、すでに理論と応用の両面でいくつかの重要な達成が報告されている。もちろん基礎研究がきわめて重要であることに変わりはない。この観点からNSF(米国立科学財団)は量子サイエンスの進歩のために7500万ドル(80億円)の資金を3つのグループに投じることを決定(NSFプレスリリース)した。

NSFのSethuraman Panchanathan(セトラマン・パンチャナタン)理事長はプレスリリースで「NSFは量子サイエンスの発展のために組織されたコミュニティ、QLCI(Quantum Leap Challenge Institutes)を通じて資金を提供する。向こう5年間でこのコミュニティのメンバーはNSLを量子革命の時代に導くような明確な成果を挙げるものと確信している」と述べた。

資金提供は2500万ドル(約27億円)ずつに分割されるが、対象は個別組織ではなく多数の研究機関からなるコミュニティだ。これには16の大学、8つの国立研究所、22のパートナー組織が含まれている。

3口の資金援助はすべて量子サイエンスの理論、実用面での進歩の促進を目的とするが、それぞれ別個テーマを追求している。

  • 相関的量子状態によるセンサー及び情報利用研究機関(Institute for Enhanced Sensing and Distribution Using Correlated Quantum States)は量子サイエンスを利用して現在よりはるかに進歩したセンサーを開発し、科学のあらゆる基礎分野に貢献することを目標としている。コロラド大学がリーダーとなる。
  • ハイブリッド量子アーキテクチャ及びネットワーク研究機関(Institute for Hybrid Quantum Architectures and Networks)は比較的小数の量子ビット数の量子プロセッサをネットワーク化することにより新しい量子コンピュータを設計し実用化することをテーマとする。 イリノイ大学アーバナ・シャンペン校がリーダーとなる。
  • 現在および将来の量子コンピューティング研究機関(Institute for Present and Future Quantum Computing)は大規模かつ誤り耐性の高い現在よりさらに進歩した量子コンピューティングの実現を目指す。量子コンピュータの可能性に対して根強く向けられている疑念を一掃し、根本的な優秀性を実証するような新たなパラダイムの確立が目的9だ。 カリフォルニア大学バークレー校がリーダーとなる。

これらの組織は、基礎的研究の常として、科学を進歩させると同時に学部生、大学院生を研究者として育成できるような資金が確保できる活発な研究分野とすることを.望んでいる。

NSFは、これ以外にも量子コンピューティング分野における研究に対して小規模なプロジェクトであっても助成を行っている

原文へ

(翻訳:滑川海彦@Facebook

投稿日:

CloudflareのDNSがダウンし、多くのウェブサイトが接続不能に

大型ウェブサイトおよびサービスの多くが米国時間7月17日の午後、Cloudflareの1.1.1.1 DNSサービス(未訳記事)の不調で接続できなくなった。切断は太平洋時間2時15分ごろから始まり、約25分間で接続は復旧した。Google(グーグル)のDNSにも同じ問題が起きた可能性がある。

アップデート:Cloudflareは太平洋時間2時46分に「原因が特定されたため現在修復中である」と発表した。CEOのMatthew Prince(マシュー・プリンス)氏は、アトランタにおけるルーターの故障が原因と説明している。

@Cloudflareのネットワークの一部に影響を及ぼす問題が生じた。アトランタのルーターにエラーが起きて、バックボーンを経由して不正なルートが発生した。その結果、弊社のバックボーンに接続しているPOPサーバーへのトラフィックが正しくルーティングされなくなった。1/2

同社がメールで発表した声明では、システムへの攻撃ではないと強調している。

「今日の午後、弊社のネットワークの一部が停止した。これは攻撃によるものではない。弊社のグローバルバックボーンルーターが不正なルートをアナウンスし、ネットワークの一部が利用できなくなったものと思われる。根本の原因は解決したと信じており、現在、システムの安定性を監視している。この件に関して、近日中にチームが更新情報を作成する予定だ」。

DiscordやFeedly、Politico、Shopify、League of Legendsなどの大型サイトが軒並み影響を受けていることから、問題の大きさを物語っている。ダウンしたのはウェブサイトだけでなく、警告を提供し停止を追跡するためのステータスページも見られなくなっていた。少なくとも1つのケースでは、ステータスページのステータスページもあった。

DNSすなわちDomain Name Systemは、ウェブの必要不可欠な部分で、TechCrunch.comのようなドメインの名前をそのIPアドレス(例えば152.195.50.33)に接続する。ユーザーやサイトが使っているDNSがダウンしても、それはそのウェブサイトのサーバーの問題ではない。そもそも一般ユーザーはDNSサーバーにアクセスすることすらできない。通常は、ISPが自分のDNSサーバーを持っている。しかしそれらは性能が良くないことが多いので、何年も前からグーグルのような代替サーバーが存在している。Cloudflareが同社のDNSサービスを立ち上げたのは、2018年の後半だ。

Cloudflareはツイートと、運良く無事だった同社のステータスページのアップデートでは「特定の場所におけるCloudflare Resolverとエッジネットワークの問題を調査している。一部地域でCloudflareのサービスを使っている顧客の中にはリクエストが失敗したり、エラーが表示されるという影響を受けた可能性がある」と述べている。

一部地域でCloudflareのサービスに問題が発声している可能性があることを確認しています。現在、調査中です。

一部のサービスやサイトはグーグルのPublic DNSサービス(8.8.8.8)を利用しており、そこでも問題が同時に起きているようだが、TechCrunchは直接そのことを確認していない。グーグルのステータスダッシュボードによれば、同社のサービスに中断は起きていない。

今回の停止の原因について多くの推測がなされているが、悪質なハッキングやDoS攻撃が行われたという証拠はない。

詳細がわかり次第、続報をアップデートしたい。

画像クレジット:mith Collection/Gado / Getty Images

原文へ
(翻訳:iwatani、a.k.a. hiwa

投稿日:

Facebook監督委員会の正式立ち上げは2020年晩秋に、最も必要とされる大統領選の後

Facebook(フェイスブック)は、コンテンツやポリシーに関する難しい判断を補佐する機関として計画していた「監督委員会」の立ち上げを、秋の終わりごろに行うと発表した。それはつまり大統領選挙選挙後ということになるが、誰もが心配しているように、選挙こそがフェイスブックが自らを監督できないことが深刻な影響を及ぼすイベントだ。

取締役会はTwitterで「コンテンツに関するFacebookの決定に独立して監視することを開始する」と投稿していたが、当分の間、それができなくて残念だとしている。さらに「私たちは長期にわたって具体的な結果を生むような強力な機関を作ることに専念したい」と説明している。

それは大いに結構なことだが、多くの人にとって2018年の終わり頃から姿を見せ始めていた監督委員会の創設は、激戦とされる次期大統領選挙に備えることが目的だった。

公式に委員会が発表された際、本誌の同僚であるNatasha Lomas(ナターシャ・ロマス)氏は次のように説明している

この監督委員会は、Facebookが日々行っているコンテンツの適正化管理(モデレーション)の苦労の上に位置する。モデレーションは、密室の中で守秘義務契約を交わした人間によって行われ、アウトソーシングされた契約部隊が、一般ユーザーに代わって下水のように流れ続けるヘイトや嫌がらせや暴力に目を光らせている。これは問題解消のためのよく目に見えるメカニズムであり、口論を収めることができる(とFacebookでは期待している)。

しかし、すぐにわかるように、多くの人がFacebook上で最も危険なコンテンツと呼ぶ、短時間で拡散する誤情報と委員会は無関係だ。委員会が主に配慮するのはコンテンツの取り下げをめぐる論争であり、その対象となっているコンテンツそのものではない。多くの問題について、委員会の決定は単なる助言に過ぎないだろう。

関連記事:Toothless: Facebook proposes a weak Oversight Board(未訳記事)

同社は、情報操作されたメディアや意図的な誤報、誤解を招く政治広告などに対して比較的放任主義な態度をとっており、Mark Zuckerberg(マーク・ザッカーバーグ)氏をはじめとする幹部たちは、その態度を定期的に強化してきた。

Facebookの財布を狙った攻撃は、意外にも功を奏した。多くの大企業が、同社のポリシーに抗議するため、少なくとも一時的にフェイスブックから自分たちの広告を止める約束している。Coca-Cola(コカ・コーラ)、Ford(フォード)、 REI(レクリエーショナル・イクイップメント)、それにTechCrunchの親会社であるVerizon(ベライゾン)までもが、#StopHateforProfitにサインしている。同社は米国時間7月7日に、この活動の代表者たちと会ったが、予想どおりその結果は彼らの失望で終わった

関連記事:Facebookボイコットのリーダーがザッカーバーグ氏とサンドバーグ氏との会談に「失望」

「本日は見るべき成果も、聞くべき言質も何もなかった」とAnti-Defamation League(名誉毀損防止同盟、ADL)のCEOであるJonathan Greenblatt(ジョナサン・グリーンブラット)氏は会談後に語った。Facebookはこの金銭的制裁が、真剣な対応するべき重大なものだと考えていないようだ。

約束されていた監督委員会立ち上げの遅れはまさに、ぎりぎりまで荷物を乗せたラクダの背に、たった1本の藁を載せるようなものだ。つまり、わずかであっても限度を超えると取り返しがつかなくなってしまうだろう。

原文へ

(翻訳:iwatani、a.k.a. hiwa

投稿日:

欧州警察が暗号化チャットアプリ「EncroChat」にマルウェアを仕込み犯罪者1000人以上を逮捕

数百人以上に及ぶ麻薬ディーラーやその他の犯罪者が現在勾留されている。これは不法行為に関する情報交換に用いられていると報じられていた暗号化チャットシステムに、ヨーロッパの警察(EURPOL、欧州刑事警察機構)が侵入した成果だ。この一見安全な通信方法が完全に失敗したことで、犯罪に焦点を当てた技術を使う闇業界に、沈静化の影響が及ぶ可能性がある。

この「ベネティック作戦」は、さまざまな警察機関、主要な地方ニュースソース、そして特に影響を受けたグループ内の人々の声を広く引用しつつニュースメディアのMotherboardが活気に満ちたかたちで報じた(英National Crime AgencyリリースEURPOLリリースBBC記事Motherboard記事)。

この作戦には、フランス、オランダ、英国、およびその他の国の多くの機関で働く何百人もの警察官が関与した。これは2017年に始まり、2か月前にEncroChat(エンクロチャット)と呼ばれるサービスがハッキングされ、何万人ものユーザーのメッセージが警察の監視にさらされてフィナーレを迎えた。

EncroChatは、Signal(シグナル)やWhatsApp(ワッツアップ)などの暗号化されたチャットアプリに比べて、いくつかの点で強化されている。EncroChatは、かつてのBlackberry(ブラックベリー)のように、カスタマイズされたハードウェア、専用OS、および独自のサーバーをユーザーに提供し、1回の購入やダウンロードでお終いではなく、年間数千ドル(約数十万円)の費用がかかる高額なサービスを提供していた。

サービス上のメッセージはおそらく非常に安全で、後から会話を編集できるようにすることで否認能力が組み込まれていた。つまり理論上はユーザーは何かを言わなかったと主張することができる。MotherboardのJoseph Cox(ジョセフ・コックスは)氏は、この会社にずっと目をつけていて、その主張や運用についてはるかに詳細を握っていた(Motherboard記事)。

画像クレジット:EncroChat

言うまでもなく、犯罪者たちの期待は完全に正しいものではなかった。2020年初頭のある時点で、警察はEncroChatシステムに、ユーザーの会話や画像を完全に暴くマルウェアを注入することに成功したからだ。このアプリが信頼されていたおかげで、麻薬取引、殺人、その他の犯罪について公然と話し合っていた。おかげで彼らは、法執行機関から簡単に狙われる存在になったのだ。

この春の期間中、(彼らにとって)驚くほどの頻度で、犯罪行為が暴かれていたが、ユーザーとEncroChatが事態を把握できたのは5月になってからだった。同社はユーザーに警告し、アップデートを配信しようとしたが、秘密は暴かれてもう手遅れだった。作戦が広く知られたことを見て、ベネティック作戦チームは攻撃を仕掛けた。

これに関連して複数の国々で逮捕された。多数のサブ作戦があったが、フランスとオランダが主戦場で、人数は合計で1000人近くだが正確な数は明確になっていない。数十丁の銃、数トンの麻薬、数千万ドル(約数十億円)相当の現金が押収された。さらに重要なことに、今回押収された通信記録からは、通常の取り締まりでは押さえられないような上流組織の人物も特定されたようだ。

違法行為に焦点を当てた最も人気のある暗号化されたチャット会社が、国際当局によってこうも完全に破壊される可能性があるという事実は、この先おそらくその勢いに水を浴びせることとなるだろう。とはいえ、FBIが常に神経を尖らし続けている、暗号化に対する米国内の動きと同様に、こうした出来事は長期的にはツールの強化につながっていくだろう。

原文へ

(翻訳:sako)

投稿日:

Festoの生体模倣ロボット最新作は人工羽毛で飛ぶ鳥と自律移動アーム

ドイツのFestoというロボティック会社は、プロトタイプロボットでカンガルーやクラゲなどの生物をつくっているだけだと思っているかもしれない。実は本格的な産業ロボットも作っているのたが、彼らのバイオメトリクス経験には驚嘆せざるをえない。代表例が羽の生えたBionicSwift(バイオニックスウィフト)とおかしな自律ロボットアームのBionicMobileAssistant(バイオニック・モバイル・アシスタント)だ。

Festoはこれまでにも空飛ぶ鳥のロボットを作っていて、10年近く前に私も記事を書いている。そのあとには空飛ぶコウモリも作っている。 しかし、BionicSwiftはもっとすごい。なぜなら、空を飛ぶ感覚を本物に近づけるために、人工羽毛を使って飛ぶからだ。

画像クレジット:Festo

1枚1枚の羽は超軽量で柔軟性がありながら極めて堅牢な発泡体で作られていて、瓦のように隣と重なり合っている。カーボン製の羽柄(はがら)に繋がれた羽は、本物と同じような翼を構成する。

関節構造の羽は鳥の羽と同じように働き、下向きの動きでは一体となって空気を押し下げ、上向きに動く時はバラバラになって空気抵抗を減らす。制御はすべて本体内で行われ、室内位置決めシステムも内蔵している。BionicSwiftsの集団は、狭い場所でも超広帯域通信を使って互いに避けながら飛び回ることができる。

もうひとつのBionicMobileAssistantの方が多少実用的に見えるかもしれないが実はそうでもない。このロボットは、車輪のついた球状の本体から腕が伸びているような形状だ。3つの “omniwheels”(オムニホイール)で駆動され、最小限の接地面積でどの方向にも簡単に移動できる。

手は、最新式ロボティック・グリッパー・デザインの集大成で、あらゆる種類の最新技術が詰め込まれている。ただし、結果は部品を足し合わせた合計に及ばない。今どきの「良い」ロボットハンドの特徴は、手のひらや指に多数のセンサーをつけたり、親指を自由に動かしたりすることではなく、掴んでいるものを認識する能力にある。飾り気のないハサミ状の手の方が、本物そっくりなものよりも、良い「手」であるかもしれない。それを支えるソフトウェア次第だ。

移動する球体という戦略も、本体の不安定さを生む。このロボットが食べ物や部品ではてぐ、スカーフを運んでいたことがそれを露呈させている。

もちろん、この手の機械を批判するのは間違っている。大切なのは実用よりも野心だ。そして、Festoから出てくるこうした興味深い作品が、ほかの何よりも未来の可能性のヒントあると理解することが重要だ。

画像クレジット:Festo

[原文へ]

球体(翻訳:Nob Takahashi / facebook

投稿日:

国が支援するコロナウイルスの偽情報がまともなニュース媒体の記事よりも速く広く拡散

オックスフォード大学のアナリストたちの調査によると、ロシアと中国とトルコとイランの国が支援している媒体からの、新型コロナウイルスに関するいかがわしい記事が世界中で、メジャーなニュース媒体の記事よりも広く共有されている。フランス語とドイツ語とスペイン語と英語の普通のニュースサイトは、ソーシャルなエンゲージメントが、これら外国起源の記事よりも少ない。

この調査は、Computational Propaganda Project(コンピューターによるプロパガンダ研究)というプロジェクトが今行なっているCOVID-19偽情報キャンペーンのモニタリングの一部だ。この調査グループは、Le Monde、Der Spiegel、El Paisのようなメジャーなニュース媒体に比べて、Russia TodayやChina Radio Internationalなどの、国が背後にいる媒体のコンテンツが、いくつかの測度で4〜5倍多く共有されていることを発見した。

彼らの初期の報告書は、このタイプのメディアの英語による共有を主に取り上げていて、それらは一般的に、「特定の記述を強調している事実もどき」、と呼ばれている。

彼らが繰り返し何度も発見したのは、主流的なニュース媒体は全体的なプレゼンスでは勝(まさ)っているが、国が支えるジャンクニュースは、一つのポストや記事あたりのエンゲージメントがはるかに多いことだ。最近の報告では、メインストリームの記事が一本あたりで平均25のエンゲージメントを集めているのに対し、国支援の記事は125だった。ユーザーやフォロワーの数は数百万もいるから、全体ではとても大きな差になる。

そのデータにはもっと細かいニュアンスがいろいろあるけど、一般的な傾向としては上のようなことが言える。偽情報はボットや通常の共有などによって広く拡散しているが、普通のニュースソースはアウトプットを増やし、初期のリーチを大きくすることで数を稼いでいる。どちらも、最初の到達数ではそれほど変わらない。しかしまだ分からないのは、英語以外のメディアでもそうか、ということだ。

さまざまなニュースソースから3週間にわたって集めたデータからは、確かに上記のようなことが言える。メインストリームのメディアは全体的なリーチは大きいが、国支援のメディアは一つの記事あたりのエンゲージメントが非常に高いことが多い。それは、国支援の媒体が論争的なネタや対立を煽るような記述を多用するからだろう。調査は次のように述べている:

  • ロシアの、フランス語とドイツ語の媒体は、ヨーロッパにおける弱い民主主義と市民の動乱を一貫して強調しているが、パンデミックに関してはさまざまな陰謀説を提供していた。
  • 中国とトルコのスペイン語の媒体は、自国のグローバルな指導性とパンデミックとの戦いを宣伝しているが、ロシアとイランの媒体はラテンアメリカとアメリカのスペイン語ソーシャルメディアのユーザーを狙った、二極分化を煽るようなコンテンツを生成していた。

もちろん、この種のクリックベイトはソーシャルメディア上で野火のように広がるが、軽率にシェアボタンを押してしまう人たちは、それがどこかの政府が支援するニュース機関が世界に不和の種を播くためにやっていることだとは、夢にも思わない。

しかし一方ではこれを、相手がやるからこっちもやる、という一種のフェアプレーと見る見方もある。

たとえば、中国の国が支援するニュースは、ウイルスが中国の生物兵器だとする、アメリカで盛んな陰謀説に対抗して、それはアメリカの生物兵器を中国でばらまいて中国に罪を着せようとしているのだ、という説を流している。

オックスフォードのKatarian Rebello氏が、ニューズリリースで次のように述べている。「これらの国支援の媒体の多くが、コロナウイルスに関する事実に基づいた信頼できる記事と、誤解を招く、あるいは偽の情報をブレンドしている。それらにより、COVID-19パンデミックを理解しようとしている一般大衆のオーディエンスの間に、大きな不安を植え付けてしまうこともある」。

ここで挙げた国が支えている媒体は、アラビア語の市場にも大きなプレゼンスがあり、研究者たちは今後の調査でそれらを含めたいとしている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

投稿日:

NASAがビッグなアイデアを持つスモールビジネスに合計55億円の助成金を支給

NASAは300以上の企業に対して、貴重なアーリーステージ資金となる新たなスモールビジネス向けの助成金を合計5100万ドル(約55億円)提供したことを発表した。今回選ばれたフェーズ1のプロジェクト(SBIRリリース)は、1つの企業が最大で12万5000ドル(約1350万円)を受け取り、新しいテクノロジーの商品化を進めることができる。

この「Small Business Innovation Research/Technology Transfer(スモールビジネス・イノベーション研究/テクノロジー移転、SBIR)」プログラムは、起業家や発明家のアイデアを研究段階から商品化へと移行させる手助けをするものだ。この資金は投資ではなく助成金に近い。さらにフェーズ1で資金を獲得した企業は、条件を満たすことでより規模の大きなフェーズ2助成金の申し込み資格を与えられる。

2020年も例年のように、数多くの学術分野、幅広い業種が対象となった。ニュースリリースで紹介されたNASAが注目するアイデア(NASAリリース)には、高出力ソーラーアレイ、都市上空飛行のためのスマート航空管制システム、月面で使用する水浄化システム、改良型リチウムイオン・バッテリーなどがある。

さらに医療現場でも使える「宇宙船素材に使用するコンパクトな殺菌装置」を開発した企業には、個別の賞も贈られた。

関連記事:NASAが月での採鉱や太陽レンズなど奇抜な研究開発に7億円超の助成金

受賞者リストを見て、放射線の耐性を持つチップからソフトウェア技術に至るまで、神経形態学的コンピューティングの研究が数多くあったことに私は衝撃を受けた。これらは実際にニューラルネットワークのスパイクや可塑性を導入するというより、機械学習手法を活用し促進させるためのヒントやアプローチなのだと私は理解した。

NASAは2019年のフェーズ2を先月発表(SBIRリリース)したばかりなので、2020年のフェーズ2の発表はまだ先になるだろう。

SBIRプログラムは、10ほどの政府機関に数十億ドル(数千億円)が割り当てられスモールビジネスに分配されるという、図らずも米連邦政府の穴場的プログラムとなっている。詳しくはSBIR.govをご覧いただきたい

画像クレジット:VICTOR HABBICK VISIONS/SCIENCE PHOTO LIBRARY / Getty Images

[原文へ]
(翻訳:金井哲夫)

投稿日:

iOS 14は犬の鳴き声を認識して聴覚障害者に通知するアクセシビリティ機能などを強化

iOSの最新バージョンには、聴覚や視覚の不自由な人たちのための機能がいくつか追加されているが、誰にとっても役に立つものもある。

おそらく最も感動的な新機能は、Sound Recognition(音認識)だろう。ユーザーが気づきたい音(ノイズ)のリストに載っている音を検出すると、iPhoneがユーザーに通知する。サイレン、犬の鳴き声、煙検知器、車のクラクション、ドアチャイム、水の流れる音、家電のブザー、などなどリストは非常に長い。Furenexoという会社がこれを実現するデバイスを数年前に作っているが、iOSに内蔵されるのはうれしい。

Apple Watchに通知を送ることもできて、オーブンが設定温度になったのを知るためにiPhoneをチェックしたくない人には便利だ。アップルは人間や動物の音を追加する作業を進めているので、システムはまだ成長するようだ。

これが聴覚障害者の役にたつのは当然だが、音楽やポッドキャストに聞き入っていて、犬の散歩や荷物を届くことを忘れがちの人にもうれしい機能だ。

オーディオ部門の新機能はほかにも、同社が「personal audiogram」と呼ぶものがあり、異なる周波数をどのくらい聞き分けられるかに基づいてEQ(イコライザー)をカスタマイズする。これは医療機器ではなく難聴などを診断するものでもないが、さまざまなオーディオテストによって、特定の周波数を強めたり弱めたりする必要があるかどうかを判断できる。残念なことにこの機能は、アップルブランドのヘッドフォンでしか利用できない。

関連記事:本日開催のWWDC20発表まとめ

Real Time Text(リアルタイムテキスト)による会話は、アクセシビリティ標準のひとつで、基本的にテキストによるチャットをビデオ通話プロトコルに乗せて送ることによって、スムーズな会話や緊急サービスの利用を非言語的な方法で可能にする。iPhoneでは以前からサポートされているが、これからはそのためにアプリを開く必要がなくなる。ゲームをしたりビデオを見ている最中に通話すれば会話がテキストで通知される。

最後に紹介する聴覚障害者向け機能は、グループFaceTime通話の隠れた変更だ。ふつうビデオは話している人に自動的に切り替わるが、手話は当然音を出さないので、話者はハイライトされない。iOS 14では、動きを手話である程度認識して(ただし内容は認識しない)その参加者のビデオ表示がハイライトされる。

Voice Overの大改造

アップルの視覚障害者向けのアクセシビリティ機能は充実しているが、改善の余地は常にある。Voice Overは10年以上使われているスマート画面読み上げシステムだが、これまで以上のUI操作を認識する機械学習モデルを採用したことで、適切なラベルのついていない項目や、サードパーティ製アプリやコンテンツも認識するようになった。これはデスクトップでも採用されるが、まだ十分ではない。

iOSの分類能力もアップグレードされ、写真の被写体を分析して高度な関係づけを行うようになった。例えば「two people sitting」(二人の人が座っている)の代わりに「two people sitting at a bar having a drink」(二人の人がバーで飲んでいる)と言ったり、「dog in a field」(広場に犬がいる)ではなく「a golden retriever playing in field on a sunny day」(晴れた日にゴールデンリトリバーが広場で遊んでいる)などと言うようになる。まあ100%正しく犬種を言い当てるかどうかはわからないが雰囲気はわかる。

拡大鏡とローターも拡張され、広い範囲の点字は自動でスクロールするようになった。

視覚障害のあるデベロッパーは、Swift(スウィフト)とXcodeに多くのVoice Over機能が追加され、コード補完やナビゲーションなどのよく使う作業の確認もアクセシビリティ対応になった。

バックタップ

「back tap」(バックタップ)は、アップルデバイスでは初めてだが、Google PixelなどのAndroid端末ユーザーにとってはなじみのある機能だ。端末の裏側を2、3回タップすることでショートカットを起動できるもので、犬のリードや紅茶のカップを持っている時に、もう片方の手で画面読み上げを起動するのにすごく便利だ。

容易に想像できるようにこれはどんな人にとっても便利で、あらゆるショートカットやタスクを実行するようにカスタマイズできる。残念ながら、この機能は今のところFace ID(顔認識機能)のある機種に限られるため、iPhone 8やSEなどのユーザーはおいてきぼりだ。秘密のタップ検出ハードウェアが使われているとは考えにくいので、iPhoneに当初から内蔵されている加速度センサーを利用していることはほぼ間違いない。

アップルが特定の機能をさしたる理由もなく人質にとるのは珍しいことではない。例えば、拡張された通知機能は、iPhone SEのような最新機種でも利用できない。しかし、アクセシビリティ機能でこれをやるのは普通ではない。アップルはボタンを有する端末でバックタップが利用できるようになる可能性を排除しなかったが、約束もしていない。この便利な機能がもっと広く利用できるようになることを願うばかりだが、時を待つほかはない。

[原文へ]

(翻訳:Nob Takahashi / facebook

投稿日:

Googleがカメラ46台を使って実現する「ライトフィールドビデオ」は物の裏側も見られる

Googleが、ふつうの写真やビデオをもっと没入的にしてしまう、とても感動的な方法を披露している。それは、見る人が遠近や視野角を変えられ、フレームの中の物の回りをぐるりと見ることもできる。ただし、46台のカメラを同期させて動かす技術と環境のない人は、この「ライトフィールドビデオ」今すぐ作ることはできない。

SIGGRAPHで発表される予定のこの新しいテクニックは、数十台のカメラが同時に撮った映像を利用して、巨大な複眼のようなものを作る。その多くの視野角や奥行き感を一つの映像にまとめると、見る人が視点を移動するとリアルタイムで情景も変わる。

研究論文に載ってるこの画像はカメラによる視界の捉え方と分割の仕方を示している。

HD以上の高精細度と移動の自由があれば、このライトフィールドビデオは本物のような現実感を見る人に与える。これまでのVR化ビデオは、以前からよくある立体眼鏡のような3Dを使うから、視点の変化に追随しない。写真の中の奥行きを理解して遠近感を加えるFacebookの方法は巧妙だが、制限がありすぎて、遠近感のほんのわずかな変化しか作り出せない。

Googleのビデオでは、見る人が頭を1フィート横へ動かすと角(かど)をぐるりと回ったり、物の向こう側を見れたりする。その像は本物そっくりに精細で動きもなめらかだが、3Dの映像なのでほんのちょっと視点を変えただけでも、それが正確に反映される。

画像クレジット: Google

そして相当巨大な装備を使うので、ひとつのシーンの、ひとつの視野角から隠れている部分も、別の視野角から見られる。見る人が右端から左端へ動いてズームインすると、まったく別の光景が見える。映画「ブレードランナー」の、あの悪名高い「拡張シーン」を思い出して、ちょっと気味が悪い。

これの最高の体験が得られるのはVRだと思うが、プロジェクトのWebサイトにはこのシステムのスチルバージョンがある。そしてChromeブラウザーを持ってる人なら、このブラウザーの実験的機能をインストラクションを読んで有効にすると、ライトフィールドビデオのデモをいろいろ見られる。

この実験は、昨年の終わりごろに見た、人間の動作を3D的に捉えるLEDの卵に似ている。明らかにGoogleのAI部門はメディアをよりリッチにすることに関心があるようだけど、車のように大きなカメラをたくさん並べて実現する技術を、Pixelスマートフォンでどうやって再現するか、それはまだ、誰にもわからない。

関連記事: Google AIのチームが開発した卵型LEDルームが人間の3Dモデルを見事に捉える

画像クレジット: Google

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

投稿日:

たった5分で普通のカメラを高画質のウェブカメラとして設定する方法

ビジネス会議にしてもソーシャルディスタンス中の社交的なビデオ通話にしても、最近では誰もがウェブカメラを必要としている。ほとんどの読者はノートパソコンの内蔵カメラや年代物の取り付け式カメラを使用していることだろう。そんな中、もしもあなたが大手ブランドによる優良カメラを持っている場合、ソフトウェアの力を少し借りるだけで、スタンドアロンのウェブカメラとして設定し、友達や同僚も羨む画像を手に入れることができる可能性がある。

照明、オーディオ、その他さまざまな設備を使用して作る、プロ並みの家庭用ウェブカメラソリューションガイドをこちらの記事で紹介しているが、デジタル一眼レフやミラーレスカメラをコンピューターに接続する作業は、想像するほど簡単ではない。

実際は100ドルほど投資すれば、カメラの信号をHDMIに変換するキャプチャカードやドングルを手に入れ、それですべてを解決することができる。しかしその行程を経ず、数分でこれを実現させたい場合の、ソフトウェアのみを使用したカメラとOSソリューションをご紹介しよう。

驚いたことに、ここ数年間にリリースされたカメラをコンピュータに接続して作動させようと思ってもだめなのである。今のところ、キヤノン、富士フイルム、パナソニックのみが少なくとも1つのデスクトップOSに無料のウェブカメラ機能を提供している。ニコン、ソニー、オリンパスの場合は、支払いが生じるか透かしが付くかのどちらかになる。

ここでは各ブランドのカメラを機能させるための最も簡単な方法を紹介する(スポイラー警告:Macの場合はほぼ全てのケースでCascableを使用することになる。読者は皆自分のカメラのブランドについて書かれている箇所までスクロールして、ここを飛ばして読んでいるだろうから、これについてはもう数回言及しようと思う)。

キヤノン:EOS Webcam Utility

キヤノンはほんの数週間前にこのソフトウェアをリリース。まだベータ版であるため問題はいくつかあるかもしれないが、同製品はWindowsとAppleの両方のマシンとさまざまなカメラ本体をサポートしている。マイクロサイトにはアプリの追加ドキュメンテーションやチュートリアルさえ用意されている。

互換性はかなり良好で、過去3〜4年間にリリースされたどのカメラ本体でも使用可能だ(Rebel T6-T7i、T100、SL2、SL3、5D MkIV、5DS、5DS R、6D Mk II、7D Mk II、77D、80D、90D、1D X Mark IIとMark III、M6 Mk II、M50、M200、R、RP、PowerShotG5X Mk II、G7X Mk III、SX70 HS)。ソフトウェアはここからダウンロードできる

問題が発生した場合は、以下に記載されている他のブランドのサードパーティ製アプリをチェックしてみて欲しい。それで上手くいく場合もある。

富士フイルム:X Webcam

富士フイルムのソリューションは簡単ではあるが、限定的である。人気のX100シリーズがサポートされていない上に、Macにも対応していない。しかし、同社の最近のレンズ交換式ボディとWindows10をお持ちの場合は幸運である。インストールして通常のUSBケーブルでカメラを接続するだけで完了だ。

X-T2、X-T3、X-T4、X-Pro2、X-Pro3、X-H1、GFX100、GFX 50R、GFX 50Sと互換性がある。ミディアムフォーマットの設定を正しく行わなければ、目元は焦点が合っても耳元はズレることになる。ソフトウェアはここからダウンロードできる

Macにおいては、さまざまな目的でカメラへの架け橋として機能するCascableがMacのソフトウェアとして便利である。同ソフトウェアの制作者はウェブカメラ機能を最近追加したところで、有線接続とワイヤレス接続の両方で幅広い互換性があり富士フイルム独自のソフトウェアよりも幅広い機能を提供しているが、これは無料ではない。しかし現在の30ドル(約3200円)という価格は、優れたウェブカメラを購入する場合と比べたら安上がりと言えるだろう。

コマンドラインを扱う自信がある場合、このチュートリアルが少しの作業とサードパーティ製ソフトウェアを用いて同社のカメラをMacで作動させる方法を紹介している。

パナソニック:Lumix Tether

パナソニックはLumix Tether Windowsアプリのウェブカメラ対応バージョンをリリースしたところだ。ドキュメンテーションの少なさから、これがかなり必要最低限なソリューションであることが見て取れる。ただし価格は適切だ。GH5、G9、GH5S、S1、S1R、S1Hに対応。同社はまた、OBSのようなストリーミングソフトウェアを使い始める方法を説明した、順を追った有益なチュートリアルを公開している。

Cascableは多くのパナソニックカメラで機能し、その上公式アプリよりも断然優れている。スーパーズーム機能で遊ぶのも楽しい。

ソニー

ソニーのカメラをウェブカメラに変えるための公式ソフトウェアは存在しないため、ワンストップソリューションが必要な場合はサードパーティ製を使用するしか他ない。Windowsに関しては、Sony Remoteを使用して画像をテザリングし、ストリーミングソフトウェアに無理やり転送するというような代替策がある。詳しくはこのビデオで説明されている。理想的とは言えないが、ひとつの手段ではある。

ここでもMacにおいてはCascableが最善策である。NEXシリーズやRX100 IIIなどのカメラ数世代分に対応している。Ecamm Liveもソニーと互換性が限定的にあるが、最新モデルしかサポートしていない。月額12ドル(約1300円)だが、試してから購入したい場合は無料トライアルもある。

オリンパス

Windowsに関してはここでも同じく、公式ソフトウェアが存在しない。しかしテザリングソフトウェアを使用してライブビュー画像を収集し、それをストリーミングソフトウェアに転送できる場合がある。

MacではCascableがStylusカメラやレトロなPEN Fなどを含む多くのモデルを有線でサポートしている。カメラもこのようなモダンな方法で使用されるとは思いもしなかっただろう。Ecamm Liveは最新モデル(E-M1 II、III、X、E-M5オリジナル、Mk II)と互換性がある。残念ながらPENシリーズはだめなようだ。

ニコン

最近ニコンは同社のカメラを使用したストリーミング方法に関するお役立ちページを公開したのだが、驚いたことにソフトウェア自体を開発することはなく、さまざまなサードパーティ製ソフトウェアを紹介している。

前述と同様に、CascableがニコンをMacで作動させるための最も簡単な方法のようだ。一方でWindowsにはSparkoCamが頻繁に推奨されている。

これからウェブカメラを設置する読者への注意点

上記で紹介した方法は簡単ではあるものの、問題点がないかと言ったらそうではない。

可能性としてはオーバーヒートがそのひとつだ。これらのカメラは主に静止画や短い動画クリップを撮影するために設計されている。長時間フル稼働することでカメラが熱くなりすぎて機能しなくなり、シャットダウンする場合がある。カメラ自体に深刻なダメージを与えることはないが、注意すべき点ではある。これを回避する最善の方法は、電源アダプターでダミーバッテリーを使用するということだ。簡単に手に入れることができ、過熱の緩和にも有効だ。

オーディオ機能は画像ほど優良でないかもしれない。本格的なビデオワークには通常外部マイクが使用されるが、これは誰にでもおすすめすることである。まともなマイクは50ドル未満で簡単に手に入れることができ、デバイスの内蔵マイクを大幅にアップグレードできることを考えると購入しない理由はない。

また、カメラの使用に際する最適な設定についてのフォーラムを確認することもおすすめしたい。数分後にカメラがオフにならないようにすることや、露出の選択などが確認するべきことの例として挙げられる。例えばここでは静止画を撮るわけではないため、解像度を心配する必要がなくワイドオープンで撮影できる。一方で、オートフォーカスが迅速かつ正確に機能していることを確認しておかないと、ピンボケ映像に終わってしまう可能性がある。いくつか異なる方法で設定してみて、最良な方法が見つかるまで試してみると良いだろう。

ここまでの準備が全て整ったら、次は背景を設置する方法を詳しく説明したガイドを読んでいただきたい。

関連記事:軍資金を全投入して自宅で最高のビデオチャット環境をつくる方法、予算別で紹介

カテゴリー:ハードウェア

タグ:ガジェット ビデオチャット

[原文へ]

(翻訳:Dragonfly)

投稿日:

アップルのApp Storeに対して開発者によるアプリのリジェクトやルールへの異議申し立てが可能に

Apple(アップル)が、近く実施されるApp Storeのルール変更を発表した。これにより、このマーケットプレイスの運用が大きく変わる可能性がある。もうすぐ開発者は、アプリのリジェクトだけでなく、その根拠となったルールにも異議を唱えられるようになる。また、ルール違反のせいでバグ修正のアップデートが保留になることはない。

重要な追加事項にも関わらず、アプリと開発者の変更点についてのブログ記事は淡々としたものだ。

まず第一に、開発者はアプリがApp Store Review Guidelinesの特定のガイドラインに違反しているかどうかの決定に抗議できるだけでなく、ガイドラインそのものに異議を唱える仕組みがある。第二に、すでにApp Storeで公開されているアプリに関しては、法律な問題に関連するものを除き、ガイドラインへの違反のためにバグ修正が遅れることはなくなる。

App Storeのルールは、今週大きく報道された。それは、収益化をめぐる論争のせいであり、メールサービスアプリのHeyが、サブスクリプションの収入をAppleと共有することをためらった(未訳記事)からだ。

これは前からよくある問題であり、Basecampの共同創業者であるDavid Heinemeier Hansson(デイヴィッド・ハイネマイヤー・ハンソン)ともあろう人が、自分のHeyについてそれを知らなかったとは思われない。しかも、アプリに関するAppleの一方的で画一的なビジネスモデルが批判されたのも、これが初めてではない。

本誌TechCrunchとのインタビューでAppleのマーケティング担当上級副社長Phil Schiller(フィリップ・シラー)氏は、ルールを変えてHeyのようなアプリが収入をAppleと分けずにApp Storeで売られるようにするつもりはない(未訳記事)と語った。

関連記事:Interview: Apple’s Schiller says position on Hey app is unchanged and no rules changes are imminent

しかし、アップルは発表で直ちにルールを変更しないが、そのうち変えるかもしれない、と言っている。開発者からのフィードバックがどのように入手され処理され評価されるのか、それはわからないが、おそらく今週の多くの開発者セッションでさらに聴取を重ね、多くの提案を受け取ってから最終的に決まるのかもしれない。

2つめの変更は、Heyがそうだったようにビジネスの問題があるせいで、セキュリティアップデートもできなかった開発者をほっとさせるだろう。開発者との交渉が行き詰まることで、ユーザーを困らせることはアップルもしたくないだろうから、両者を分離することは完全に正しい。これによって、扱いにくい開発者に対してアップルが振るう鞭(むち)が短くなり、しかもユーザーなど他の関係者のリスクは少なくなる。

App Storeのルール変更は今夏に発効するため、それまでに詳細が決まるだろう。

画像クレジット:Bryce Durbin

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

投稿日:

アップルもWWDCで翻訳アプリを発表、オフラインで日本語など11言語に対応

翻訳は何百万という人が毎日スマホで使っている機能だ。しかしいくつかのマイナーな機能を除き、Apple(アップル)は概ねライバルに遅れをとっている。しかしこうした状況は一変する。同社は「Translate」という機能そのままの名称の新たなiOSアプリを発表した。11言語に対応し、インターネット接続は不要だ。

このアプリは話し言葉あるいは短いテキストで使用するためのものだ。言語のセレクター、テキスト入力スペース、録音ボタン、そのほかお気に入りや辞書といった追加のウィジェットが用意されている。

差し当たってTranslateが対応する言語は英語、北京語、フランス語、ドイツ語、スペイン語、イタリア語、日本語、韓国語、アラビア語、ポルトガル語、ロシア語で、今後他の言語も追加される。使うには、言語2つを選び、文言をペーストするか音声を録音する。すると、翻訳されたものがすぐに表示される。

インターフェースをシンプルにできるランドスケープモードもある。

このアプリの最も優れている点は、他の翻訳アプリと異なり完全オフライン仕様となっていることだ。つまり通信状況に関係なく、あるいは普段使っている通信会社のサービスが届かないところでも利用できる。通信データ量を節約するのにもいい。

リリース詳細はまだ明らかになっておらず、おそらくiOS 14へのアップグレードで使えるようになる。

関連記事:WWDC20関連記事まとめ

カテゴリー:ソフトウェア

タグ:Apple WWDC

[原文へ]

(翻訳:Mizoguchi

投稿日:

どういうわけかTwitterにはアクセシビリティ専門チームがない

Twitterにはアクセシビリティを専門とするチームがない。ある開発者がそうほのめかした後、同社はこれを認めた。約4000人を雇用し、CEOが「正しいことをする」とよく言っている企業にアクセシビリティのチームがないとは不可解だ。

ほかの主要プラットフォームと同様に改善の余地はまだまだあるものの、Twitterにアクセシビリティ機能がまったく欠けているわけではない。しかし画面読み上げや字幕を利用する人だけでなく、誰にとっても操作しやすいサイトにするには、気にかけている従業員がときどき対応するだけでは不十分だ。

Twitterの開発者で、障がい者に役立つ機能を多く手がけてきたAndrew Hayward(アンドリュー・ヘイワード)氏のツイートから、Twitterにアクセシビリティのチームがないことに広く関心が集まった。

Twitterの新しい音声ツイートに字幕機能がないと批判された際、公式のTwitter Supportアカウントは、これは「この機能の初期バージョン」であり、この機能をより使いやすくする方法を「これから探る」と述べたが、解決になっていない。

ヘイワード氏はこのやり取りに関し、同氏をはじめとする「Twitterのアクセシビリティを支えるボランティア」は障がい者に対する配慮が欠けていることに「不満と失望」を感じていると述べ、専門のチームがないという驚きの状況を示唆した。同氏が明らかにしたところによると、携わっているスタッフは完全なボランティアではなく有給の従業員ではあるが、「我々がやっている仕事は通常の役割にさらに追加されたものと考えられる」という。つまり同氏らは、基本的には空き時間にアクセシビリティに関する作業をしてきた。

専任のアクセシビリティチームは、規模の小さい企業では贅沢であるように感じられるかもしれないが、Twitterは小さいとも新しいとも、その機能の重要性が知られていないとも主張できるような会社ではない。従って、たとえ数人であってもアクセシビリティに責任を持つ専任チームがないのはなぜか、理解に苦しむ。

筆者はTwitterに、専任のアクセシビリティチームがないのかどうか確認を求めた。同社はコメントの代わりに、以下の3つのツイートへのリンクを知らせてきた。その内容は、誤りを認めたうえでの謝罪、基本的な問題の応急処置、そしてTwitterが「全製品にわたるアクセシビリティ、ツール、アドボカシーに専念するグループをどう構築するか検討している」という表明だった。

視覚障がい、ろう、聴覚障がいの方々へのサポートをせずに音声ツイートのテストをしていることをお詫びします。こうしたサポートがないままのテストの開始は誤りでした。
アクセシビリティは、決して後回しにしてはいけないことです。(1/3)

つまり、専任のチームはなく、チームを作る計画を始めたばかりにすぎないという返答だ。我々は近いうちに進捗状況をTwitterにまた確認するつもりだ。

画像クレジット:TC/Bryce Durbin

[原文へ]

(翻訳:Kaori Koyama)

投稿日:

米連邦通信委員会の委員がSNS関連の大統領令を非難、我々の専権事項と主張

米連邦通信委員会(FCC)委員のGeoffrey Starks(ジェフリー・スタークス)氏は、ソーシャルメディア企業に対して行動を起こすよう駆り立てる大統領令(未訳記事)を精査し欠陥を見つけ出した。委員長は「この議論にFCCが加わるべきでない十分な理由がいくつもある」と指摘し、「これは我々の先見事項だ」と発言した。

この大統領令は、Facebook(フェイスブック)やYouTube(ユーチューブ)などのプラットフォームへの違法なコンテンツの投稿に関して、法に従いそれらを削除するよう努力する限りは責任を負わなくてよいと保証した米通信品位法230条を標的にしている。

政府内部には、この保護が行き過ぎており、ソーシャルメディア企業による言論の自由の抑圧につながると考える者もいる。トランプ自身も、今回の大統領令の直接のきっかけとなった郵便投票の不正を訴える根拠のない主張にファクトチェックの必要性を警告するラベルが添付されたことで、明らかに抑圧を感じている。

関連記事:トランプはソーシャルメディアの法的保護に圧力をかけTwitterと交戦状態に(未訳)

スタークス氏はこの件に関する意見を、 テクノロジー関連の問題を研究する左派のシンクタンクInformation Technology and Innovation Foundationのインタビューで述べた。彼はFCCの5人の委員の中の一人に過ぎず、FCCはこの大統領令について、いかなる形であっても公式な見解はいまだ示していないが、法律上また手続き上の深刻な問題点を指摘する彼の言葉には重みがある。

「この大統領令は、1つのことをはっきりと正しています。大統領は、FCCにあれこれ指図はできないという点です」と同氏は話す。「我々は独立機関なのです」。

同氏は、法律は完璧ではないという自身の考えを示すことに注意を払っていた。つまり、このような形での法律の変更は、まったく正当化されないということだ。

「230条に関しては、特にトランプ大統領とTwitterが対立するよりもずっと以前から、広く議論されていました。この法律は更新すべきだと考える非常に聡明な人たちも大勢います」と彼は説明した。「しかし、最終的にこの論議は議会に委ねられることになります。大統領は、538名の議員を擁する連邦議会ではなく、委員5名の委員会に圧力をかけるほうがずっと好都合だと気づくでしょうが、それは民主的に選ばれた国民の代表による憲法に基づく機能を出し抜く理由として十分ではなく、ましてや納得の行くものではありません」。

米司法省も関与をはじめ、本日230条の改正ついて独自の提言(米司法省文書)を行った。しかしホワイトハウスと同様、司法にもFCCの責務を直接変更したり、でっち上げたりする権限はない。

一部の議員も、同じように法案の提言を始めているが、署名して法律として成立させようと賛同する者は現れない。

関連記事:ソーシャルメディアを攻撃するトランプの大統領令が最初の法的問題に直面

別の委員であるJessica Rosenworcel(ジェシカ・ローゼンウォーセル)氏も彼の懸念に同調し、大統領令に対する早期の声明でこう表現している。「ソーシャルメディアは不満に思うでしょうが、FCCを大統領の発言監視役にしたところで、答にはなりません」。

FCC230条の「誠意ある」行動の定義を狭めることの難しさと不要性に関する法的制約について細かく説明したあとにスタークス氏は、この大統領令は、その文脈においてまったく意味をなさないと結論付けた。

「米国憲法修正第1条は、ソーシャルメディア企業に投稿内容の検閲を、政府には不可能な方法で自由に行うことを許しています。また修正第1条は、政府が言論に関してそれらの企業に報復することを禁じています」と同氏は話す。「大統領がここで提案していることの非常に多く、大部分が、その中核的概念に沿っておらず、そのためFCCはルール作りにさらに消極的になるのです」。

「最悪のシナリオは、大統領令に何らかの信頼性を与えるという怠慢を許し、私たちの民主主義の機能を圧迫することです。インターネットのサービスプロバイダーには確実な法的支援は与えないと、今後の規制制度に脅しをかけることです」。

とはいえ同氏は、この大統領令は必ずしもトランプ大統領が望む解決策にならなくとも、FCCが何らかの行動を起こすべきだと訴えていることも認識している。

「私は、できるだけ早く申立書を寄こすよう(米国家電気通信情報管理庁に)催促するつもりです。大統領令が出されてから、申立書を送るのに30日以上もかかる理由がわかりません。それを受けて私たちは行動に出ることができます。FCCは申立を精査し、投票を行います」と彼は言う。「そしてもし、結局そうなるのではないかと懸念しているのですが、申立が当局の法的問題によって失敗した場合には、私たちははっきりと声をあげ、この不幸な遠回りを終わりにするべきだと考えています。大統領選挙をいいことに保留にされ、私が恐れているように民間企業が脅かされることにならないよう注意しなければなりません」。

判断の多くは委員長であるAjit Pai(アジード・パイ)氏に委ねられることになる。彼は一貫して、政権の意向に沿ってきた。そしてもし、大統領支持者のCarr(カー)委員の熱意(FCC文書)が何かしらの傾向を示しているとしたら、大統領の「指導の求め」に連邦通信委員会の共和党系委員が喜んで対応することになる。

これまでのところ、大統領令に関連するFCCの行動について公式な発表はないが、米国家電気通信情報管理庁が迅速に動けば、早ければ来月の審査会で話が聞けるだろう。

関連記事:SNSは民主主義を守らなければならない、たとえ相手が大統領でも

画像クレジット:Bryce Durbin / TechCrunch

[原文へ]

(翻訳:金井哲夫)

投稿日:

蚊が媒介するマラリアなどの伝染病を不妊化したオス蚊をドローンで撒いて予防

繁殖力をなくしたオスの蚊をドローンで散布し、蚊の個体数の削減や蚊が媒介する伝染病の蔓延を抑える取り組みを大きく前進させられることが、複数の研究機関からなる研究者チームの実証実験で明らかになった。改善されたこの手法を使えば、多くの命を救うことができる。

蚊は世界中の人たちにマラリアの感染を広げ、数え切れないほどの死者や健康被害をもたらす公衆衛生上の敵だ。蚊を罠で捕獲するのも予防の一助になるが、積極的に虫の数を減らすアプローチも有効であることが証明されている。それは、オスの蚊を不妊化して自然に放つという方法だ。放たれた蚊は、他のオスの蚊と餌や交配相手を求めて競うことになるが、子孫は残さない。

問題は現場での作業が多いことだ。蚊による被害が多い地域に人が足を運び、不妊化した蚊を定期的に放たなければならない。空中散布やその他の散布方法も試されているがフランス、スイス、英国、ブラジル、セネガル、その他の国々の研究者からなるこのプロジェクトの方法が、今のところもっとも効果的で実用的なようだ。

大量に飼育され、放射線で不妊化したオスの蚊は、低温でカートリッジに詰められる(「チルド」蚊は飛んだり刺したりしない)。このカートリッジは、目標地域に運ばれるまで冷蔵保存される。その輸送はドローンが行う。

マーカーを付けてチルド保存され、散布準備が整った数千匹の蚊。画像クレジット:Bouyer et al

ドローンは規定の高度に上昇し、目標地点まで移動して、飛行しながら数千匹の不妊化したオスの蚊を満遍なく散布する。街の中心地に拠点を置けば、ドローンのオペレーターは、ドローンのカートリッジを新しいものに交換して、さらに別の場所に飛ばすことができるため広い地域をカバーでき、人が直接行う方法と比べて行きにくい場所へも即座かつ簡単に散布できる。

実験では、マーカーとして蛍光色に染められた蚊を使い、空から撒いたときの効果を追跡したところ、人の手で散布する場合と比較して、時間と労力が削減できたにも関わらず、大幅な効果の改善が見られた(改善率は50パーセント以上)。不妊化、パッキング、蚊の駆除における新方式が、この結果にさらなる上げている。

もちろん、この手法には平常時においても様々な応用が考えられるが、現在のパンデミックのような特別な状況では新たな危険をもたらす恐れがあると、研究者たちは指摘している。新型コロナウイルス(COVID-19)と蚊がもたらす疾患との併存疾患に関しては、特に研究がされておらず、サプライチェーンと普段の害虫駆除の取り組みが停滞している間は、マラリアやデング熱といった伝染病の激増を招きかねない。

こうした研究は、数十億人の健康に改善をもたらす可能性がある。研究チームの研究結果は、Science Roboticsで詳しく解説されている(Science Robotics記事)。

画像クレジット:Bouyer et al
[原文へ]
(翻訳:金井哲夫)

投稿日:

ロケットラボの次回ミッションは前回からわずか3週間後の打ち上げ

Rocket Lab(ロケットラボ)は同社13回目の商業ミッションで、毎週打ち上げというゴールに近づきつつある。「Pics Or It Didn’t Happen(証拠写真がなければ起きてはいない)」というニックネームのミッションは、予定通りにいけば前回からわずか3週間後の打ち上げとなる。

前回ミッションの「Don’t Stop Me Now」は米国時間6月13日土曜日に無事軌道に到達した(未訳記事)。次の打ち上げは天候などの条件が整えば米国時間7月3日に予定されている。

「ロケットラボは小型衛星が軌道へ行くための待合室をなくした。ここ数年間で短期間の打ち上げ能力の強化に注力し、まもなくその成果を小型惑星コミュニティのために実用化できることを誇りに思っている」とCEOのPeter Beck(ピーター・ベック)氏はプレスリリースで語った。

「Pics」は「ライドシェアリング(相乗り)」顧客の貨物を3種類積載する。

  • Canon(キヤノン)のCE-SAT-1Bは、軌道からの映像を提供し、超小型衛星プラットフォームの量産に向けて試験を行う。
  • Planet(プラネット)の観測衛星であるSuperDove Earth(スーパーダブ・アース)5基は、軌道にいる数百基の仲間たちに加わる。
  • In-Space Missions(インスペースミッションズ)のFaraday-1(ファラデー1)は、ソフトウェアを軌道に送り込みたいスタートアップをターゲットに、同社プラットフォームの有用性をデモする。

新しいロケットのElectron(エレクトロン)は、18日毎に1基生産されているが、そのペースで打ち上げられるという意味ではない。それでも十分な需要があることは間違いない。軌道に乗せるためには、ただロケットを立てて大きな赤いボタンを押すよりもはるかに多くの仕事が必要だ。

この3週間のインターバルは特別短いが、先週末の打ち上げが本来数カ月前に予定されており、パンデミックのために見送られただけでなく、天候によっても遅れたことを忘れてはならない。つまりこの短いターンアラウンドは素晴らしいものに違いないが、まだ継続的なものではない。それでもロケットラボは2021年中の月例ミッションを目指しており、同社の新しい米国拠点の打ち上げ施設が稼働すれば、頻度は高まるばかりだ。

関連記事:Rocket LabがNASAゲートウェイ計画の試験衛星を月軌道に打ち上げる

画像クレジット:Rocket Lab

[原文へ]

(翻訳:Nob Takahashi / facebook

投稿日:

Facebookの判別コンペはディープフェイク抑止に有望な第一歩

深層学習を利用して生成されたフェイク動画であるディープフェイクはますます勢いを増しており、巨大プラットフォームをもつサービスは、ディープフェイクをいち早く見抜く必要に迫られている。

これがFacebookがディープフェイクを見抜くコンテスト、Deepfake Detection Challengeを昨年スタートさせた理由だ。数カ月のコンペを経て優勝者が決定された。その結果はといえば、完全というには遠い。しかし当てずっぽうよりはましだ。ともかく我々はどこからか始めねばならない。

登場したのはここ1、2年だが、ディープフェイクはAIカンファレンスのデモ用のニッチなおもちゃから、政治家やセレブのフェイクビデオを誰でも作れるソフトに進化した。そうしたフェイクビデオは本物と見分けがつけにくく、制作するソフトは誰でもイ簡単にダウンロードできる。

FacebookのCTO(最高技術責任者)であるMike Schroepfer(マイク・シュレプファー)氏はこのコンペについての電話記者会見でこう述べた。「クリックするだけでダウンロードでき、Windowsマシンで動くディープフェイク生成ソフトを私は手に入れている。本物と判別する方法はない」。

今年は米国大統領選挙がある。悪事を企む連中がディープフェイクを使って候補者に言ってもいなないことをしゃべらせ、有権者を誤った方向に誘導しようとする最初の大統領選になるに違いない。このところ一部から非難を浴びているFacebookとしてはディープフェイク対策は極めて重要だ。

去年このコンテストがスタートしたとき、ディープフェイク動画のデータベースも登場した。従来は研究者が利用できるディープフェイクの大型データベースがなかった。ある程度のサイズの偽動画のコレクションはいくつかあったが、このデータベースのようにコンピュータビジョンのアルゴリズムを改良するのに役立つような本格的なデータセットはまったく存在しなかった。

Facebookは3500人の俳優にギャラを払って数千のビデオを製作した。それぞれオリジナル版とディープフェイク版が用意された。ディープフェイク以外にも「雑音」として他の手法による改変も行われた。これはアルゴリズムに偽物を見破ろうために決定的な部分、つまり顔にに注意を集中させようとするためだった。

Facebookのコンペには世界中の研究者が参加し、ビデオがディープフェイクかどうかを 判断するシステムが何千も提案された。下に6種類のビデオをエンベッドしたが、そのうち3つはディープフェイクだ。どれがそうなのか読者は判別できるだろうか(正解は記事末)?

画像:Facebook

こうしたアルゴリズムの精度は当初は偶然より高くなかった。しかし繰り返巧妙なチューニングを施した結果、フェイクを識別する精度が80%以上に達するまでに改善された。残念ながら、システムの製作者に予め提供されていなかったディープフェイク動画でテストした結果は最高で65%程度にとどまった。

つまりコインを弾いて裏表で判断するよりはましだが、その差はあまり大きくはない。 しかしこれは最初から予期されていたことであり、今後の改良を考えれば非常に有望な結果といってよい。人工知能の研究で最も難しいのは、ゼロから何かを生み出す部分だ。その後は猛烈なスピードで改良が進む。ともあれAIで生成されたディープフェイクを判別するという課題がAI自身によって解決可能だということが判明しただけで大きなだ一歩だ。これが実証できた点がFacebookのコンペの最大の成果だろう。

オリジナルと各種の改変を受けたビデオの例(画像: Facebook)

重要な注意点は、Facebookが生成したディープフェイクのセットは単にサイズが大きいだけではなく、さまざまな手法を包括的し、ディープフェイクの最前線を代表するようなものになるよう意図されている点だ。

結局のところ、AIの有効性は入力されるデータ次第だ。AIシステムのバイアスはデータセットのバイアスが原因であることが多い。

シュレプファーCTOは「もしAIのトレーニングセットに現実の人々が遭遇するディープフェイクを代表するようなバリエーションを持っていなければ生成されたモデルも現実のディープフェイクを充分に理解できない。われわれが苦心したのはこのデータセットができるかぎり代表的なものであるようにすることだった」と述べている。

私はシュレプファー氏に「ディープフェイクを判別しにくい顔や状況のタイプがあるか?」と質問したが、この点ははっきりしなかった。この点に関するチームからのコメントは以下のとおりだ。

このチャレンジで利用するためのデータセットを製作するにあたっては自称する年齢、性別、民族等、多数の要因を考慮した。判別テクノロジーはどんな対象であっても有効に機能する必要があるため、データが代表的な例を網羅することが重要だった。

業界の競争を促すため、コンペで優勝したAIモデルはオープンソース化される。Facebook自身も独自のディープフェイク検出システムの構築に取り組んでいるが、シュロップファー氏によれば、これは公開されないだろうという。マルウェア対策同様、この問題は本質的に敵対的だ。「悪い連中」は対策者のシステムから学び、自分たちのアプローチを改良する。つまり何をしているかすべて公開することはディープフェイクを抑止するために逆効果となる可能性がある。

(ディープフェイク画像判定問題の正解:1、4、6は本物。2、3、5がディープフェイク)

画像:Facebook

【Japan編集部追記】上のビデオはダートマス大学で開催されたディープフェイクとメディアについてのフォーラム。右端がTechCruchのDevin Coldeway記者。ビデオでは俳優がオバマ大統領ビデオに合わせてアフレコで別のことを言わせるビデオが紹介されている。

原文へ

(翻訳:滑川海彦@Facebook

投稿日:

OpenAIがテキストベースのAI機能利用が簡単になる汎用APIを開発

これまでにOpenAIご自慢の機械学習ツールセットを試してみたいと思ったことがあるだろうか。それがずっと簡単なものになった。同社は、開発者がAIツールを「事実上どんな英語のタスクに対しても」呼び出すことができるようなAPIを発表した(OpenAIリリース)。

基本的には、英語の単語を理解することを求められるタスクがある場合、OpenAIはそれを自動化したいと考えている。少なくともプライベートベータに参加できれば、自然言語理解モデルのGPT-3ファミリーのさまざまな機能を、開発者は自由に使用することができる。また、アクセスのリクエストはここから可能だ。

実際にどのように見えるものなのかは、何をしたいかに依存するため、説明するのが少し難しい。例えば大量のテキストを一度に調べて、記載に関する質問に回答したり、関連する部分を見つけたりする機能を利用できる。短いデモビデオで、OpenAIはこれがどのように機能するかを説明している。パンに関するWikipedia記事に対して、「なぜパンがとてもふわふわ(fluffy)なのか」と尋ねると、記事の中にあるパンのテクスチャーとその形成に関する部分が返される。

これはシンプルな例だが、GPTを使ったテキストアドベンチャーゲームである有名な「AI Dungeon」はもっと複雑なものだ。AIには多数のD&Dソースブックと冒険が与えられ、そうした基礎に基いてプレイヤーの入力に対して即興的な旅が与えられる。これまでは、こうしたことは基本的にはモデルのバージョンをローカルで実行するという面倒な手段を使って達成しなければならなかったが、今では単純にAPIを経由して入力を送り込むことができるようになった。

基本的に、これはGPT-3の幅広い言語理解と生成機能にアクセスするためのはるかに簡単で単純な方法なのだ。単にテキストを入力して、テキストを出力するだけだ。

関連記事:OpenAIの新たな音楽活動はエルビスの不気味の谷に入った

「私たちは、このAPIがAIを活用した有益な製品を開発するための障壁を大幅に下げ、今日の段階では想像しがたいツールとサービスが生み出されることを願っています」と同社はブログ投稿で述べている。確かに1年か2年前にはAI Dungeonを想像することは困難だっただろう。

また、APIの有害または乱用は直ちに禁止されることも明記されており、OpenAIにとっては、モデルを実際に世の中にリリースするよりも安全なことと思われる。「モデルが実際の現場でどのように利用されるのかを予測することは難しいので、有害なアプリケーションが生まれたときにアクセスを制御できないオープンソースモデルをリリースするよりも、APIを介してリリースを行い、時間をかけてアクセスを広げて行くほうが、本質的に安全だと感じています」とブログには書かれている。

これまでのところOpenAIは数十社と提携して、世の中に広く提供する前にAPIをテストしている。チャットボット、教材、法的調査など言語は私たちが行うほとんどすべての定義と記録に使用されているため、この種の応用には終わりがない。とはいえこのようなAIエージェントが本当に役立つ場所を正確に見つけるためには、多少実験が必要だ。

既にAI Weirdness(AIウィアドネス)のJanelle Shane(ジャネル・シェーン)氏は、犬を評価している別のTwitterアカウントを参照して、無限に犬を評価し続けるボットを作成してアイデアを実験している。

トップ画像クレジット: OpenAI
原文へ
(翻訳:sako)

投稿日:

たった数分の作業で、あなたも現在活動中の火星探査車のAIを成長に協力できる

火星探査車Curiosityは赤い惑星にそろそろ8年もいるが、旅の終わりはまだまだ見えないし、現在もアップグレードが行われている。あなたも自分の数分間をこのプロジェクトに捧げて、その地形走査AIのために生データのラベル付けをすることができる。

Curiosityは単独では走行しない。地球上のチームが火星から送られてくる画像を分析し、火星の動く科学研究所のために行路を指示している。しかしそのためには、岩や土、砂、その他の特徴がどこにあるかを正確に理解するために、画像を注意深く調べる必要がある。

これはまさに機械学習が得意とする作業だ。いろんな目立つ特徴のある画像を、正しいラベルを付けて大量に与えてやれば、ラベルのない画像の中に類似の特徴を見つけることができるようになる。

しかし人間の顔や、猫、犬といったラベルが付いた画像はすでに大量にあるが、火星の地表の画像に地形タイプのラベルを付けたデータは、まだ多くない。

NASA / JPLのAI研究者である小野雅裕氏はニューズリリースの中で次のように述べている。 「通常、数十万枚のサンプル画像があれば、ディープラーニングのアルゴリズムを訓練できる。例えば自動運転車のアルゴリズムは、道路や標識や信号、歩行者、その他の乗り物といった大量の画像で訓練される。一般に公開されているディープラーニング用のデータセットもあり、それらには人や動物、建物などが写っているが、火星の地形はない」。

そこでNASAはそんなデータセットを作るために、あなたの協力を求めている。

画像クレジット:NASA / JP

より正確に表現すれば、Soil Property and Object Classification(土壌の特性とオブジェクトの分類)と呼ばれるアルゴリズムはすでに存在しているが、彼らはその改善するための助けを求めているのだ。

NASAはすでに、市民科学プロジェクトのサイトであるZooniverseに数千枚の火星の画像をアップロードしており、事前にチュートリアルを読んで、誰もが数分でそれらに注記を付けることができる。岩や砂地などのまわりに、それらの輪郭線を描くことは簡単そうに思えるが、これは「大きな岩」だろうか、それとも「岩盤」か?幅は50cm以上あるが、高さはどれくらいなのか?すぐにいきづまることもある。

これまでのところ、目標の約9000枚のほぼ半分にラベルが付いた。画像は今後もっと増えるだろう。誰もが、暇な時間が数分間あれば協力することができる。責任や義務は発生しない。現在は英語版のみだが、近くスペイン語とヒンズー語、日本語などにも対応する。

AIが改良されれることにより、探査車は走行可能な場所だけでなく、トラクション(対地摩擦)を失いそうな場所が事前にわかり、車輪の配置を調節したりもできるだろう。SPOCの地形分類が正確なら、これまでのように人間が画像を何度もチェックする必要もなくなり、Curiosityの動きを計画しやすくなる。

このミッションのウェブページで、Curiosityの進捗状況に注目しよう。

関連記事:NASAでもリモートワーク、Curiosityチームが自宅から火星探査機を運用中

画像クレジット:NASA / JPL-Caltech

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

投稿日:

透明な外科手術用マスクに投資家が殺到、スイス拠点のHMCAREが約1.1億円を調達

スイスのÉcole polytechnique fédérale de Lausanne(スイス連邦工科大学ローザンヌ校、EPFL)から生まれたHMCAREが、透明で環境にも優しい透明な外科手術用マスク(EPFLリリース)を開発し、100万スイスフラン(約1億1300万円)の資金を調達した。

創業者は、2015年のエボラ出血熱のアウトブレーク時における医療関係者たちの仕事ぶりや、患者と緊密に働きながらも顔を見せることができない世界中の小児病院の職員に触発された。また、免疫が弱い患者の親や家族たちも、顔の2/3を隠して彼らと人としてのつながり作らなければならないことにも触発されている。

これまでにも透明なマスクは存在していたが、それらは一般的なマスクに透明な窓を付けたもので、その窓はすぐに曇り、通気性がなかった。同社のCEOであるThierry Pelet(ティエリー・ペレ)氏は、医療現場の厳しい要求を満たす透明マスク素材のプロトタイプをEPFLの同僚たちに提案した。それらは空気は通すものの、ウイルスや細菌は通さないというものだった。

チームは、スイスの素材センターであるEmpaと協力して、新しいタイプの繊維を開発した。バイオマス由来の透明繊維を100nm(ナノメートル)間隔でシート状に配置し、それを3層にすることで、柔軟性と通気性がある素材を作った。ほぼ透明に近い、すりガラスのような素材だ。それはHelloMaskと呼ばれている。

この素材は大量生産が可能で、通常の布のようにマスクを作ることができる。コストは高いが、世界は現在マスクを求めており、透明なマスクというアイデアは投資家の目にも止まる。HMCAREはあっさりと100万フラン(約1億1300万円)のシードラウンドを完了し、それまでの研究開発は寄付や補助金でまかなうことができた。

マスクの発売は2021年初頭を予定している。一般消費者向けに販売される可能性もあるが、当初は医療コミュニティ向けとなるだろう。

画像クレジット:EPFL

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

投稿日:

レーザー測距技術のLiDARで発見された長さ1km以上の古代マヤの遺跡

LiDAR(レーザー測距技術)は、考古学の世界でも、最も効果的なツールのひとつとして、急速に認められつつある。それ以前なら、ジャングルを切り開いて人手で計測するなど、数カ月にも及ぶ作業の末にようやく発見できたかもしれないものを、わずか数時間で明らかにすることができる。最近も、3000年も前のマヤ文明の建造物が発見されたばかりだ。大きさは1辺の長さが1km以上もあり、おそらく天体の観測に使われたのではないかと考えられている。

画像クレジット:Inomata et al

この巨大な人造の台地について、ネイチャー誌に掲載された論文の筆頭著者は、アリゾナ大学の猪俣健氏だ。この前例のない構造物は、このようなタイプとしてこれまでで最大かつ最古のもの。2年前にグアテマラで発見された「マヤのメガロポリス」にも匹敵するものだろう。

関連記事:マヤの巨大古代都市を発掘したレイダーは考古学を変革するか

このような巨大な構造物、列をなす基礎、その他の人造的なものは、見ればすぐにそれとわかるだろうと思われるかもしれない。しかし地上にいる限り、それらは想像するほど明らかではない。通常、木々に覆われ厚く草が生えているからだ。

「私はフィールドワークに何千時間も費やしてきました。森を一直線にナタで切り進む地元の人の後ろをついて歩きました」と、人類学者のPatricia McAnany(パトリシア・マカニー)氏も書いている。彼女は、今回の研究には参加していないが、ネイチャー誌にコメントを寄せている。「この時間のかかる工程では、グアテマラのTikal(ティカル)や、ベリーズのCaracol(カラコル)など、古代マヤの都市の地図を作るのに、何年も、場合によっては何十年ものフィールドワークが必要だったのです」。

下に示したのは、この場所を上空から見た映像だ。そこに何かがあることを知らなければ、なんとなく幾何学的に見える丘があること以外、何にも気づかないだろう。

LiDARは対象物によって反射するレーザー光線から、その物、あるいは地面までの距離を測定する。強力な計算技法を用いることで、森林を透過して、その下にある地面の高さを知ることができる。それにより、地面の詳細な標高マップを作成できる。

今回研究者は、グアテマラとの国境に近いメキシコのタバスコ州の広い領域を選んだ。そのあたりは、初期マヤ文明があったことで知られている地域だ。まずその領域全体を、低解像度のLiDARでスキャンして、先行調査した。それに基づいて絞り込んだ領域を、より高い解像度でスキャンすることで、以下に示すような画像が得られた。

そこに出現したのは、Aguada Fénix(アグアダ・フェニックス)と呼ばれることになった巨大な儀式場だった。その中でも重要なのは、高さは10メートルを超え、長さが1.4キロメートルある人工の台地だ。こうした巨大な台地は、季節の移り変わりを通して太陽の動きを追跡し、さまざまな儀式を行うために使用されたという説が提示されている。中でも、アグアダ・フェニックスが最古、かつ最大のものだ。

高解像度のLiDARによるマップは、他の発見にも寄与している。例えば、当時の指導者を敬うような彫像や彫刻がないことで、アグアダ・フェニックスを建造したコミュニティは「おそらく、それほど不平等なものではなかった」と考えられる。これは、炭素年代測定からわかる紀元前1000〜800年ころの他の社会と同様だ。そのような巨大なプロジェクトは、財力を持った中央政府の支援と指示がなければ完成し得なかっただろう。そう考えると、マヤ文化の発展に関する通説を覆す可能性もある。というのも、当時のマヤのコミュティは小さく、安定したものではなかったと考えられてきたからだ。

こうしたレーザースキャン技術の進化も、ほとんどの人は自動運転車が歩行者を避けるための手段としか考えていないだろう。アグアダ・フェニックスについてさらに詳しく知りたければ、Nature誌や、このナショナル・ジオグラフィックの記事で読むことができる。

関連記事:Startups at the speed of light: Lidar CEOs put their industry in perspective(未訳記事)

原文へ

(翻訳:Fumihiko Shibata)

投稿日:

FCCからの242億円の罰金と複数の州からの訴訟に直面するがロボコール業者たちはわずかしか払わない

人間の悪辣さの頂点を極めた2人の男が、2019年の最初の数カ月だけで約10億回のロボコール(自動音声勧誘電話)を行ったことを認め、現在FCC(連邦通信委員会)の2億2500万ドル(約242億円)の罰金(米国政府記事)と、それ以上の額に達することが見込まれる複数の州司法長官たちからの訴訟(米国政府記事)に直面している。しかし、実際に彼らがそれを支払うということにはならないだろう。

悪名悪いテキサス人のJohn Spiller(ジョン・スピラー)とJakob Mears(ジェイコブ・ミアーズ)は、怪しげなクライアントからの健康保険を販売することを目的として、1日に数百万のロボコールを行なう2つの会社を設立した件で訴訟を受けている(彼ら自身も自白している)。

彼らの行為は、米国内のDo Not Callレジストリ(セールス電話禁止を希望する電話番号登録制度)を無視しただけでなく、「そうした消費者を対象とする方が収益性が高かった」ために、特に対象として選んでいたのだ。しかも番号が偽装されていたために、怒ったユーザーたちがコールバックを行った結果、相手が何もわからず当惑するという事態が起こり、ますます事案は悪質化した。

これらの電話は2年間で数十億件にのぼり、最終的にFCC、複数の州司法長官および業界の詐欺防止協会によって事態が暴露された。

現在、この2人は2億2500万ドル(約242億円)の罰金を突きつけられているが、これはFCC史上最高額となる。また訴訟には複数の州が関与し、それぞれのケースでさまざまな法的損害賠償が含まれており、控えめな金額の見積もりでもFCCの罰金額を上回る可能性がある。

残念ながら、これまでもそうであったように、こうした罰金額は実際に支払われる金額とはほとんど相関関係がないようだ。FCCとFTC(連邦取引委員会)にはこれらの罰金の徴収を強制する権限がなく、執行は司法省に任されているからだ。そして司法省が実際にお金を集めようと試みたとしても、彼らは被告が持っている以上のものを徴収することはできない。

例えば2019年、FTCは1人のロボコール業者に500万ドル(約5億4000万円)の罰金を科したが、彼が払ったのは時価で売り払った彼のベンツの代金1万8332ドル(約200万円)だけだった。当然のことながら、こうした知能犯罪に関わる犯人たちは、処罰を回避する方法を知らないわけではない。連邦政府がドアをノックする前に現金資産を処分しておくことは、そうしたゲームの一部に過ぎない。

こうした場合、状況はさらに悲惨なものになる可能性がある。司法省が関与することすらしない場合だ。FCC委員のJessica Rosenworcel(ジェシカ・ローゼンウォーセル)氏は、同庁の発表にともなう声明の中で次のように述べている。

この総力戦には欠けているものがあります。司法省です。彼らはこの詐欺に取り組む一員ではないのです。なぜなのでしょう?彼らが関与することを拒否することで、どんなメッセージが送られるでしょうか?

私が受け取るメッセージは以下のようなものです。過去数年間、FCCは今日ここにいる者たち同様に、ロボコール業者に対して数億ドル(数百億円)の罰金を科してきました。しかし、これまでのところ、こうした目を見張るような罰金に関する徴収実績は、ほぼ無きに等しいものなのです。実際、何億ドル(数百億円)もの罰金に対して、私たちがせいぜい6790ドル(約73万円)しか集められていないという計算を、ウォールストリートジャーナルが発表したのは2019年のことです。何故でしょう?まあ、ひとつの理由は、FCCが司法省にロボコール業者からの罰金徴収を頼っているからです。私たちには彼らの助力が必要なのです。したがって、彼らが動いてくれない場合には、つまり今回のようにということですが 、それは良い兆候ではありません。

確かに、FCCからの罰金と訴訟はこうしたロボコール業者を廃業させ、より多くの詐欺行為を防止するものの、彼らは億万長者ではないため、実際には数億ドル(数百億円)を負担することはない。

罰金がこのような事業を破産させるほど大きなものであることは良いことだが、2018年にまた別の莫大な罰金がロボコール業者に科されたときにローゼンウォーセル氏が述べたように、「それは小さじ1本で海をカラにしようとするようなもの」なのだ。FCCと各州は2人のろくでなしを追い詰めたものの、さらに多くのろくでもないヤカラたちが同じようなことを狙って出現する可能性は高い。

ロボコールを抑制するための業界全体の対策は何年も前から行われてきたものの、何度もの警告と遅延が繰り返された後、ようやくFCCによって最近義務付けられたのだ(未訳記事)。2021年には新しい詐欺対策フレームワークが施行されることを期待しよう。

画像クレジット:Bryce Durbin / TechCrunch

原文へ
(翻訳:sako)

投稿日:

IBMが顔認識技術から撤退、CEOは偏向と不平等の廃絶を訴える

米国時間6月8日、IBMのCEOであるArvind Krishna(アービンド・クリシュナ)氏は、今後、同社は顔認識サービスを販売せず、そもそもそれを使うべきか否かに関する「国民的議論」を、と呼びかけた。彼はまた、警察の暴力を減らしその説明責任を高める新しい法案の支持を表明した。

CNBCが報じた書簡の中で、6月8日に導入程された法案「Justice in Policing Act」(米国下院司法委員会プレスリリース)の支持を表明する中で、サービスとしての顔認識技術という議論の余地の大きい事業からの撤退について説明している。

IBMは、監視社会や人種判別、基本的人権と自由への違反のために他のベンダーから提供され、あるいはまたは私たちの価値観および弊社のPrinciples of Trust and Transparency(信頼と透明性原則)と整合しない、顔認識技術などいかなる技術の利用も認めない。私たちは今こそ、顔認識技術を我が国の法執行機関が採用すべきか否か、採用するとしたらどのように採用すべきかに関する国民的対話を始めるべき時であると信じる。

このような技術の実用化に関する慎重なアプローチは、新しいものではない。2019年にIBMは、現在利用できるどんな顔データよりも多様性に富む顔データの新しいデータベース(未訳記事)でそれを強調した。結局のところ、他のプログラムと同様にシステムの価値はそこに供給する情報の価値と同程度しかない。

関連記事:IBM builds a more diverse million-face data set to help reduce bias in AI(未訳記事)

しかしながら、顔認識は同社の収益性にあまり貢献していないようだ。率直にいってこの技術はまだ初期段階であり、IBMのようなエンタープライズベンダーにとって意味のあるアプリケーションはほとんどない。議論を招いたAmazonのRekognitionサービスは一部の法執行機関で試用されたが、評判は良くない。まだ十分な実用性が認められていない製品分野で他社と競合することは、IBMにとって割に合わない事業行為だろう。

クリシュナ氏の書簡ではさらに「AIシステムのベンダーとユーザーは、AIが偏向に関して十分テストされていることに対する責任を共有している。それが法執行機関で使われるときにはなおさらであり、またそのような偏向試験は監査され報告されなければならない」と述べている。この発言は現在この分野に関係する人や企業、中でもAmazonに対する決別のようであり、顔認識技術のお粗末な品質と、それにも関わらず販売を止めようとしない人々に対して投げかけられている。今後、同社がこの方向でAIに関する研究を続けていくかは不明だ。

クリシュナ氏が支持を表明している法案には、下院と上院で相当数の共同起草者がおり、警察と彼らが監視する一般市民が直面する多様な問題をとり上げている。特にテクノロジー方面ではボディカメラの要件を拡大するとともに、それらで撮った写真に顔認識技術を使うことを制限している。ハードウェアに対する政府の補助はありえるが、ただしそれは公的に定められ列挙されたプロトコルの下で使われる場合に限られる。

ACLU(アメリカ市民的自由連合)はこの法案に関する声明で、ほぼ同意しているようだ。声明では「デジタルの格差をなくす技術への投資が必要であり、警察権の濫用や構造的な人種差別を激化させる監視社会のインフラストラクチャを作る技術は要らない」と述べている。

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

投稿日:

秘匿性の高いメッセージングアプリ「Signal」に顔をぼかす機能が加わる

今のような不安な時期には、Signalのようなアプリが特に貴重だ。人に知られたくない情報を安全かつ簡単に共有できる方法なら、何でも歓迎したい。そのためにSignalは、このアプリで送る写真の中の顔をぼかす機能を加えて、ほかのあまり安全でないアプリに痕跡を残さずに、特定の人のアイデンティティ(本人情報)を容易に保護できるようにした。

創業者のMoxie Marlinspike(モクシー・マーリンスパイク)氏はブログで、今世界中に広がっている警官の暴力に対する抗議活動への支持を表明したあと「路上にいるみんなを支援するためのさまざまな方法を考えている。とりあえず今年は、顔を隠す方法が必要だ」と語る。

写真の中に顔を見つけて画像をぼかすツールはほかにもあるが、Signalの来歴から考えると不可逆性、元に戻せない機能を実装したいだろう。現在同社に、技術の詳細を問い合わせているところだ。とにかく、 既存の技術を使って写真の中のすべての顔を1回のタップでぼかす機能は作れるはずだ。
画像クレジット:Signal

この機能は、Signalを使って秘密の情報を送っているすべてのユーザーに役に立つ。例えば、写真なら、その人が誰か知られたくない。写真編集アプリを使って顔をぼかすことはできるが、この簡単な方法は必ずしも安全でない。写真編集という計算集約的なプロセスをクラウドから提供しているアプリなら、元の写真をホスト側に保存するかもしれない。そうなると、その写真が今後どんな目に遭うかわからない。

人に知られたくない情報はすべて、自分のスマートフォンか、または信頼するアプリに保存したい。そしてSignalは以前から、通信の秘密を冒されたくない人々に愛用されている。

同氏によると、Signalの場合、顔の検出とぼかしはすべてユーザーのスマートフォン上で行われる。ただし顔の検出は100%正確ではないので、ツールが見つけてくれなかった顔はユーザーが手作業でぼかし処理する。

この新しい機能は、GoogleとAppleの承認が得られ次第、Signalアプリの最新バージョンに登場する。

最後に同氏は「さまざまなもので顔を隠せる機能を無料でコミュニティに提供したい」と語る。例えば、上の写真では冬に顔を覆う防寒具のようなもので、顔を隠している。今後が楽しみなアプリだ。

画像クレジット: Signal

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

投稿日:

米大統領選を控えてフェイスブックが国家管理メディアに対するラベル導入へ

近くFacebook(フェイスブック)は政府が所有または管理するメデイアであること表示するラベルを導入する。コンテンツの真偽は別として、サイトのそのような成り立ちはユーザーの考慮に値するという考えだ。このラベルが付されれたサイトはこの夏以降、広告の掲出が禁止される。

数か月前に同社は米国の大統領選挙における不正防止の努力の一環として、ページの所有者を確認すること、国家が関与するメディアに対してラベルづけし選挙干渉広告を禁止することなどを考えていると述べていた。

来週、全ユーザー向けに公開される予定のフェイスブックの新機能によれば、「政府の影響下にあることが疑われる」ニュース組織のプロフィールや投稿には、サイズは大きくはないが明瞭に認識できるラベルが付加される。下の画像がこのラベルだ。下方に「このページについて」と「詳細説明」に表示される例を挙げた。

ラベルの警告は上記のとおり。「この投稿者は全体として、あるいは部分的に国家による編集の管理を受けています。 これは資金、組織、ジャーナリズムがあるべき基準を含むさまざまな要素を考慮して決定されています」とある

こうした組織は本拠とする国の外で膨大な投稿を拡散している。OCP(オックスフォード・コンピュータ・プロパガンダ)プロジェクトはこのような動きを詳細にモニターして国家による情報拡散の詳細とその戦略(The Computational Propaganda Project記事)を多数のレポートにまとめている(The Computational Propaganda Project記事)。

上の警告にもあるとおり、国家が関与するメディアを特定するプロセスは簡単ではない。チャイナデイリーやスプートニクなどの国営報道機関は多数の国に存在する。しかし政府の関与は公然たるものとは限らない、資金を供給する(あるいは資金調達を妨げる)ことで編集に影響を与えることができる。また、なんらかの方法で国家の関与を隠して組織そのものを運営することもある。

Facebookは専門家グループに依頼して投稿する報道機関の分析と分類を実行した。 専門家は着目すべき要素が多岐にわたることを明確にしたようだ。その結果、Facebookは分類にあたって公式発表、所有権の構造、利害関係者、編集にあたる幹部、方針、運営、またこれも重要な点だが、当該国における言論の自由の状況などに基づいて、「国家によるコントロール」の有無を認定することとなった。報道機関側では認定が不当だと考えた場合、Facebookに再検討の申し入れを行うことができる。

当然ながらこのラベルは、そのようなラベルを付与された記事を引用しただけの記事や組織には適用されない。またこのラベル付き組織が投稿した記事そのものに自動的に特別な調査やファクトチェックが行われるわけではない。

しかし同社のサイバーセキュリティの責任者であるNathaniel Gleicher(ナサニエル・グライシャー)氏は「そのような限界はあっても、11月の米国大統領選挙に対する外国政府の各種の干渉の防止を確実なものとするために、この夏の後半以降、こうした組織からの米国における広告のブロックを開始する」とブログに書いている。

米国以外の国ではこうした広告はブロックされないが、「国家によるコントロール」のラベルは表示される。

原文へ

(翻訳:滑川海彦@Facebook

投稿日:

山火事のシーズンが近づく中、AIが衛星画像を使って危険な地域を教える

地球温暖化と天候パターンの変化でここ数年の米国は壊滅的な山火事に苦しめられた。そしてこの、本来なら普通の自然現象は、きわめて予測不可能で深刻な災害になった。そこでスタンフォード大学の研究者たちは、機械学習と衛星画像を利用して危険な乾燥地域を調べ予報する方法を見つけた。

これまでの、山火事になりやすい森林や低木地帯の検査方法は、手作業で枝や葉を集め、その水分を調べた。それは正確で信頼できる方法だが、きわめて労働集約的で大規模な調査は難しい。

しかし幸いにも最近は、その他のデータソースを利用できる。欧州宇宙機関(European Space Agency)の人工衛星センティネルとランドサットは、地表の画像を大量に集めており、それらを詳しく分析すれば山火事のリスクを評価するための二次的なデータソースが得られる。しかもこの方法なら、木の枝の棘に刺される心配もない。

衛星画像を利用する観測方法は以前から存在するが、人間の目で判断するため極端にサイト固有の結果になりがちだ。つまり、場所によって分析方法が相当異なっている。棘の心配はないが、広い面積の調査は難しい。スタンフォードのチームが利用した新しい方法では、センティネル衛星の「合成開口レーダー」を利用して森林の林冠を貫き、その下の地表の画像を見る。

スタンフォードの生態水文学者Alexandra Konings(アレクサンドラ・コーニングス)氏はニュースリリースで「私たちの大きな突破口は、これまでよりもずっと長い波長を使う新しいタイプの衛星に着目したことです。それによって森林の林冠のずっと深いところの水分を観測できるようになり、それは燃料水分の含量を直接表しているのです」と語っている。

チームは2016年から定期的に集めたこの新しい画像を、米国林野局が手作業で計測したデータと共に機械学習のモデルに与えた。これによってモデルは、画像のさまざまな特徴と地上の測定値との相関を学習した。

次に彼らは、そうやって得られたAIエージェントに、彼らがすでに答を知っている古いデータで予報をさせ、テストをした。結果は正しかったが、そのほとんどが低木地帯で、それは米国の西部で最も多いバイオームであり、山火事になりやすい植物相でもある。

プロジェクトの結果をこの対話的なページで見ることができる。西部全域の1年の各時期における、モデルから得られた乾燥度の予報を示している。消防士にとって具体的に役に立つ、というものではないが、でも同じモデルに最新のデータを与えれば、今後の山火事シーズンに関する予報ができ、当局が延焼をコントロールし、危険な地域や安全性に関する警報をするための、情報に基づく決定ができるだろう。

研究結果は、Remote Sensing of Environmentに載っている。

画像クレジット: スタンフォード大学

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

投稿日:

Crew Dragonの最新型宇宙服は通信装置と温度調節の機能を内蔵、タッチパネル対応グローブも装備

米国時間5月27日、スペースシャトルの引退以来、初めて人間を軌道に打ち上げる米国製宇宙船に乗るのはもちろん人間だ(悪天候のため5月31日に延期)。この人たちが着る最新型宇宙服も、また歴史的なデビューを果たすことになる。本日の打ち上げ(ライブ配信)に先立ち、NASAとSpaceX(スペースエックス)はその新型宇宙服の新鮮な姿を公開した。もうすぐ、たくさん見ることになるだろうが。

この宇宙服は、NASAと、今回宇宙船に乗り込む宇宙飛行士Bob Behnken(ボブ・ベンケン)氏とDoug Hurley(ダグ・ハーレー)氏との協力のもとでSpaceXが開発した。彼らは、現代の素材と技術を使い、Crew Dragon(クルー・ドラゴン)と一体化できる着心地のいい形状を目指した。

ただし、こちらもNASAでデザイン変更が進められているのだが、何十年間も使われてきたおなじみのEVAスーツ(船外活動用宇宙服)に置き換わるものでないことは知っておくべきだろう。今回、ベンケン氏とハーレー氏が着るのは、戦闘機のパイロットが着るものと同様の与圧服だ。短時間の真空状態や高熱といった打ち上げの際に想定される危険から身を守るために飛行士の体に合わせて作られるもので、外宇宙には出られない。

 

NASA:店では売ってません。LaunchAmerica宇宙服は特注品です

このSpaceX製の宇宙服は、耐火性と耐衝撃性を備え、通信装置と温度調節の機能を内蔵する。ヘルメットには、当然ながら無線とマイクが組み込まれていて、空気と電源は、宇宙船内の各飛行士の座席に接続する1本のヘソの緒のようなケーブルで供給される。

「このスーツの開発で重視したことに、簡単に使えるという点がありました。飛行士が着座したとき、文字どおりただプラグインするだけで、後は宇宙服が勝手にやってくれるという感じです」とSpaceXのChris Tripp(クリス・トリップ)氏は、スーツを紹介したNASAの動画で話している。「これはまさに宇宙船の一部なのです。そのため私たちはこれを、スーツとシートの一体型システムと考えています」。

この10年間のエレクトロニクスとソフトウェアの進歩を考えると、宇宙飛行士にもミッションコントロールにも、進化し簡便化されたコミュニケーションが期待されてしかるべきだ。ノイズリダクションや音声検知など、私たちがビデオ通話に求めるような機能は宇宙でも大いに活躍する。

もう1つ、面白い変化があったのはグローブだ。頑丈であると同時に柔軟でなければならない。さらに導電性も必要だ。Crew Dragonの操作はタッチパネル方式だからだ。操作のたびにグローブを外さなければならないのでは煩わしい。

関連記事:タッチで操縦する宇宙船Crew Dragon、僕らはまた一歩SF映画に近づいた

「彼らとともに操作の癖を特定してゆきました。明確な操作ができるために、タッチのミスをなくすために、間違った入力を防ぐために、その人のタッチの仕方を画面に登録しておくのです」と、先日のNASAの記者会見でベンケン氏が話していた。

宇宙船に積み込まれるその他の物と同じく、宇宙服も今回初めての実地テストとなる。とは言えもちろん、あらゆる評価が事前に社内で済まされている。

「見栄えが良く、それでいて高性能なスーツを完成させるのに、3年から4年近くかかりました」とSpaceXの創設者でCEOのElon Musk(イーロン・マスク)氏は先日のインタビューで話していた。「いつか自分もあれを着たいと、子どもたちに夢を与えたいのです。宇宙飛行士になりたい、進化した宇宙船で宇宙航空エンジニアとして働きたい、と熱い思いを抱かせたいのです。今こそ、宇宙への夢に再び火を点けるときです」

関連記事:SpaceX初の有人宇宙飛行は天候不順で延期、打ち上げは日本時間5月31日早朝に

画像クレジット:NASA

[原文へ]

(翻訳:金井哲夫)

投稿日:

ソニーのZV-1カメラはビデオブロガー向け優れもの

ソニーは突然成立した巨大なマーケットに狙いを定めたようだ。つまりビデオミーティングやビデオブログをできる限り経済的に高画質で実現できるようなカメラに対する需要だ。それがZV-1の狙いだろう。ソニーは豊富な機能を誇る既存のRX100シリーズのコンパクトデジカメをビデオカメラ化した。ソニー自身がVlogカメラというだけあってビデオブロガーが殺到している。こうした層が求める機能すべて備えたプロダクトに仕上がっているからだろう。

ZV-1は、評価も高く大成功を収めたRX100をベースとしている。 このシリーズは長年の間に機能、価格ともにアップしてきたが、どちらかといえばユーザーは置きざりにされた印象がある。ソニーはこの点を考えなおし、ZV-1を逆方向に進化させた。

20メガピクセルの1インチ撮像素子と35mm換算で24-70mm相当のF/1.8-2.8レンズはRX100から借用したものなので画質は十分優れているはずだ(ビデオブロガーはさらに広角のレンズを望むかもしれないが)。このカメラはセルフィー的な撮り方を十分考慮してデザインされている。

そのため明るいところで威力を発揮する電子ビューファインダーは省略され、サイドフリップ式で前方に向けることができるタッチ式のバリアングル液晶モニターを備えた。筐体上部の大きな部分を占めるのは強力なマイクロフォンアレイだ。 ZV-1には風ノイズを防ぐウィンドスクリーンが付属しており、ホットシューに取り付けられる(かなり目立つ外観となる)。

画像クレジット:Sony

録画をスタートさせるシャッターボタン(赤い丸でマークされている)が大型化されたのはカメラを自分に向け、右手でバリアングル画面を操作すると、左手でボディを保持するすることになるからだ。

またその前方に親指で操作できる位置にズームダイヤルが用意されている。また「背景ぼけ切り換え」を選択すると絞りを最大に開き人物の背景をボケさせることができる。最新のスマートフォンが使っているようなAI処理で人物を認識して背景にボケ処理を加えるような力仕事をする必要がない。また「商品レビュー用設定」はビデオブロガーがプロモーションしたい商品にカメラを近づけると自動的にフォーカスが合う。これもうまいしかけだ。

新旧さまざな世代のハードウェアを組み合わせて同じことをしようとすれば試行錯誤でひどい苦労をすることになる。箱から取り出せばすぐに使えるというのはプロダクトとして説得力がある。RX100の画像品質と信頼性は実証済みだ。これにセルフィービデオ用特化したエルゴノミクスを組み合わせ、複雑なセットアップを簡単に実現できる機能を搭載している。このカメラは多くの人々を引きつけることができそうだ。

発売は2020年6月からだが価格は無論エントリーレベルのカメラよりは高い。しかしミラーレス一眼、交換レンズ、マイクなどを揃えるのに比べて同機能を実現するためのコストははるかに安い。また比較にならないくらいユーザーフレンドリーだ。

【Japan編集部追記】日本での発売は6月19日、価格は9万1000円程度になるもよう。多機能グリップと予備バッテリーが付属するキットも準備されている。ソニーのサイトはこちら

画像クレジット:Sony

原文へ
(翻訳:滑川海彦@Facebook

投稿日:

Goolgeマップが車椅子やベビーカーで利用できるトイレや施設の表示を追加

Google(グーグル)は、重要かつ長年待望されていたに違いない新機能をGoolgeマップに追加した。車椅子が利用可能かどうかの情報だ。車椅子で利用できる店や観光スポット、トイレその他の施設に明瞭なサインが表示されるようになる。

歩行の不自由な人だけでなくベビーカーなどを利用する人など、スロープや自動ドアなどの設備を必要としている人は無数にいる。グーグルは施設のアクセシビリティ情報を何年も収集していたが、このたび新しい仕様によって日の目を見ることになった。

同社はGlobal Accessibility Awareness Day(世界的にアクセシビリティの認識を深める日)に合わせて、公式ブログで新機能を発表した。機能を有効にするには、Goolgeマップアプリの「Settings」へ移動し「Accessibility settings」で 「Accessible places」をオンにする。

これで、検索したりタップした場所がアクセシビリティ対応していれば、小さな車椅子アイコンが表示される。住所や営業時間の出てくる詳細画面にいけば実際に利用できる設備がわかる。残念ながら設備のある細かい位置は表示されていないが、車椅子で入れる入り口やトイレがあることがわかることだけでも第一歩だ。

こうした情報は自動的に生成されるのでも、設計図から取り込んだものでもなく、いつものグーグルと同じくユーザーから得られたものだ。登録ユーザーなら誰でも、店の受け取りサービスなどの情報と同じように、アクセシビリティ設備の存在を通知できる。位置説明画面の「About」へ行って、一番下の「Describe this place」ボタンを押せばいい。

[原文へ]

(翻訳:Nob Takahashi / facebook

投稿日:

フェイスブック、YouTube上で使える体が不自由な人のためのTobiiの視標追跡アプリ

今日までのアプリやサービスには標準のアクセシビリティがなく、通常のスマートフォンやマウス、キーボードなどを使えない人たちのための良質な代替手段がないことが多い。視標追跡(eye-tracking)技術のリーダーであるTobiiは、一連の人気アプリを視線でコントロールできる方法を発明した。

アクセシビリティの専門家であるサードパーティのデベロッパーと協力して同社がこれまでに作り上げたアプリはFacebook(フェイスブック)、FB Messenger、WhatsApp、Instagram、Google(グーグル)、Google Calendar、Google Translate、Netflix(ネットフリックス)、Spotify、YouTube、MSN、そしてAndroid Messagesだ。

これらのカスタムアプリは、Tobiiの視標追跡タブレットであるI-Series、またはTobiiのハードウェアとソフトウェアを使用するWindows PC用だ。

しかしこれまでのユーザーは、これらのサービスのための一般的なウェブインターフェイスを使うか、ネイティブアプリになんらかのレイヤーを追加する必要があった。しかしボタンやメニューなどは視標追跡向けに設計されておらず、小さすぎて操作しづらかったりことも多かった。

ニューバージョンもウェブアプリがベースだが、視標追跡を念頭に置いて設計されているため、大きくわかりやすいコントロールが用意されており、アプリの通常のインターフェイスが右側にある。シンプルな方向を示すコントロールはもちろん、コンテキストやアプリ固有の指定ができるコントロールもある。例えばネットフリックスを閲覧するときは「ジャンル」を使うことができる。

同社は上記写真に写っている1人のユーザーであるDelaina Parrish(デライナ・パリッシュ )に紹介している。彼女はInstagramなどアプリを使ってFearless Independence(怖くない自立)というブランドを立ち上げているが、脳性小児麻痺のため十分にアプリを使いこなせないことがある。彼女はTobiiのプレスリリースで「これらのアプリにアクセスできるようになり、毎日の生産性とコミュニケーションのチャネルが、プライベートと仕事の両方で改善され、多くのことを自分でできるようになりました」と語っている。

障碍者が使える「十分に良い」ツールやインターフェイスと、アクセシビリティを最初から目標として作られたものとの違いを課題評価することは難しい。新しいアプリは、互換性のあるデバイスなら今すぐ利用できる。

画像クレジット: Tobii

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

投稿日:

NASAのアルテミス協定が宇宙協力に関する新ルールを起案

NASAの月への帰還計画はそれだけでも十分に意欲的だが、同機関はその過程で宇宙における国際協力をより現代的にしようと狙っている。NASAは米国時間5月15日に、自主的なガイドラインのセットである「Artemis Accords(アルテミス協定)の概要を発表した。それは、NASAのパートナーである国や組織が協力して、宇宙の探究と宇宙産業の大きな目的をグローバルに前進させることを狙いとしている。

宇宙はいかなる国家主権の下にもなく、またそれ自身の主権もないため当然ながら無法状態にある。そのためこの協定案も、宇宙法というよりも共有されるべきプライオリティの集合をなるべく明確に書き表したものになっている。既にに多くの国がさまざまな協定や条約に参加しているが、宇宙探検の進歩と、すぐそのあとにやってくるであろう植民や資源採掘などの問題は、既存の体制ではとうてい扱えない。全面的な書き換えが喫緊の課題であり、そしてとりあえずNASAが最初にペンを握ることにしたのだ。

関連記事:ホワイトハウスが新たな「国際月協定」推進を示唆

アルテミス協定は古いルールや協定の重要性を再確認しながらも、いくつかの新しいルールを持ち込んでいる。それらは現段階ではあくまでも一般的な記述であり、具体化のためには今後数カ月ないし数年にわたる協議が必要となる。

ルールとその理由を説明しているNASAの声明は短く、明らかに一般の人向けを想定している。ただしここでは、読みやすくわかりやすくするために箇条書きにまとめた。

最初は新しいと思われるルールだ。NASAとパートナー諸国は以下について合意する。

  • 方針や計画を透明なやり方で記述し、公開する。
  • 「安全区域」を作る位置とその運用の一般的な性質を公開し、抗争を避ける。
  • 国際的なオープンスタンダードを用い、必要なら新しいスタンダードを開発し、実用的な範囲内で相互運用性をサポートする。
  • 科学データを全面的かつタイムリーに一般公開する。
  • 歴史的価値のある遺構や人工物を保護する。例えばアポロ計画の着地点はまだ法的に保護されていない。
  • 軌道デブリの減少を計画的に行う。寿命を迎えた宇宙船は安全かつタイムリーに処分する。

ご想像どおり、これらのどれもが多くの新しい問題を提起する。例えば「透明」とはどういうことなのか? どのような運用をどんなタイミングで公開すべきか? 「歴史的価値」を誰が決めるのか?

今後いろいろなことが長期間にわたって議論されるだろうが、基本的な想定として「秘密主義はいけない」や「アポロ13号の着陸船を盗むなかれ」などのルールは、会話を始めるための良いきっかけになるかもしれない。

Jim Bridenstine(ジム・ブライデンスタイン): 宇宙の探究の新しい夜明けだ! 名誉なことに、本日、アルテミス協定を発表する。月への人間の帰還事業に参加する国際的パートナー全員が共有するビジョンを確立し、原則を設定する。私たち全員が一緒に進むのだ。

一方、この協定は、既存の条約やガイドラインへのNASAの賛意を再確認している。NASAとパートナーは以下を遵守する。

  • Outer Space Treaty(宇宙条約)に準じ、すべての活動を平和的な目的のためにのみ行う。
  • Agreement on the Rescue of Astronauts(宇宙救助返還協定)などの協定に基づき、遭難した宇宙飛行士を助けるためのすべてのリーズナブルなステップを行う。
  • Registration Convention(宇宙物体登録条約)に基づき、宇宙に送られるオブジェクトを登録する。
  • 宇宙の資源の取り出しと利用は、Outer Space Treaty(宇宙条約)の第II、VI、XI条に基づいて行う。
  • パートナー国に「安全区域」について知らせ、Outer Space Treaty(宇宙条約)第IX条に従って調整する。
  • 国連の宇宙の平和利用委員会のガイドラインに基づいてデブリを減らす。

アルテミス計画では2024年に次の米国人男性と初めての女性を月に送ることを目標としているが、そのスケジュールは日増しに不可能の様相を呈している。ミッションはコスト削減のために民間の打ち上げプロバイダーとそのほかの商業的パートナーに前例のないほど大きく依存し、それでいて必要なレベルの信頼性と安全性を維持しようとしている。

関連記事:NASAの月ロケット打ち上げは計画から2年遅れで予算オーバーとの内部報告

画像クレジット:NASA

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

投稿日:

ソニーがAIチップ内蔵の画像センサーを製品化

ソニーが、興味深いハイブリッド技術を開発した。1つのICに画像センサーとAIによる処理システムを載せたハードウェアだ。画像とコードの融合がますます進んでいる現在では、その利点とアプリケーションの可能性はとても大きい。

コンセプトは比較的単純で、いまやどんなスマートフォンにでも使われているCMOSセンサーを、ロジックチップの上に載せるだけだ。これによって、CMOSセンサーからピクセル情報を取り出すだけでなく、それらのピクセルから情報を抽出する機械学習モデルを操作することができる。

つまり、写真をコンピューターのメインのロジックボードやGPUやクラウドなど外部へ送る前に、その写真に対して単一の電子回路が画層補正などのさまざまな処理を行う。

実際には、こういったイメージセンサーには、ピクセルの並べ替えやJPEGへの圧縮などの通常の作業を行うコンパニオンプロセッサがすでに搭載されている。しかし、これらのプロセッサは、ほんのひと握りの一般的なタスクを素早く実行することに特化している。。

ソニーによると同社が開発したチップは「もっと高度な処理と出力ができる」という。例えば、野原で犬を撮影した場合、チップはすぐにオブジェクトを解析し、画像全体を送信するのではなく、「犬」や「草」など認識したものを報告するだけでいい。

即興的な編集を行うこともできる。例えば、花だけを残りして茎は切り取るといった、写真の内容を認識して指定した部分だけをトリミングすることが可能だ。

このようなシステムの利点は、データがメインのデバイスのストレージや処理のパイプラインへ行く前に、不要なものを取り除けることだ。その後の処理コストを節減できるだけでなく、余計なものが写り込まないので、セキュリティの点でも有利だ。

公共の場所に置かれたカメラは、人の顔や車のナンバーを画像を出力する前にぼかせるだろう。スマートホームのデバイスなら、訪れた人の顔の画像だけを残したい。多重露出によって、カメラが視界としている世界のヒートマップや頻度マップも作れる。

AIをチップレベルで統合すると、節電や処理の高速化も期待できるかもしれない。しかし、最近Appleが(アップル)が買収したXnorなどは、そのようなタスクを非常に迅速かつ低コストで実行できることを示している。

もっと複雑な処理になると強力な大型チップの領分だが、このような前処理は非常に多種類の貴重なデータを作り出すことができるので、正しく設計されていれば攻撃や悪用に対してより堅牢な画像データを得られるだろう。

いまのところ、ソニーが「Intelligent Vision Sensor」と命名したこのハードウェアはプロトタイプのみで、テスト用にオーダーできるだけだ。しかし、同社は画像センサーでは世界のトップメーカーなので、今後はさまざまな用途に特化した、ありとあらゆる種類のデバイスに搭載されていくだろう。

関連記事
コードが写真の未来を創る
エッジコンピューティングを再定義するXnorのクラッカーサイズの太陽電池式AIハードウェア

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

投稿日:

コンピュータービジョンで製造作業員の動きのエラーを検知、トヨタも手を組むInvisible AI

「組み立て作業」と聞けば製造プロセスでの単純な過程を思わせるかもしれないが、組み立て式家具を購入したことがある読者なら、これがいかに腹立たしく複雑な作業になり得るかお分かりだろう。Invisible AIはコンピュータービジョンを用いて、明らかな危険を回避し、安全性と効率性を維持するため、組み立て作業を行う人々をモニターすることを目的としたスタートアップだ。同社は360万ドル(約3億8000万円)のシードラウンドを活用してこの目的を達成する予定である。

Invisible AIは、高度に最適化されたコンピュータービジョンアルゴリズムを用いてカメラに映る人々の動きを追跡する、内蔵型のカメラコンピューターユニットを製造している。作業員の動きを模範的な動き(作業が正しく実行されている場合の様子)と比較することにより、システムがミスを監視したり、不足パーツや怪我などワークフローにおける問題を特定したりすることができる。

このシステムは一見どうみても、労働者が絶えず上昇し続ける人工的な基準を満たせない場合、それを逐一罰するコンピューターの皮を被った冷酷な監督のようなもののように感じられる。おそらくAmazonはすでに採用しているだろう。しかし、共同創設者兼CEOのEric Danziger(エリック・ダンジガー)氏は、そういった意図はまったくないと説明する。

「この製品の最も重要なポイントは、これが作業者自身のために作られたものだということです。これらの労働には熟練した技術が必要とされ、彼らは仕事に対して大きな誇りを持っています。最前線で仕事をしているのは彼らであり、ミスを見つけて修正することはとても重要な部分です」。

「こういった組み立て作業は、かなり肉体的でペースの速い労働です。15ステップを記憶し、その後場合によってはまったく異なるバリエーションのタスクへ進まなければなりません。すべての工程を頭に入れていなければならずとても難しい仕事です」とダンジガー氏は続ける。「目標はリアルタイムでその流れの一部になるということです。作業者が次のパーツに移る際に、同製品が再確認をして『ステップ8をとばしていますよ』という具合に伝えることができる。これにより多大な苦労を回避することが可能です。たとえケーブルを差し込むという程度のことでも、そこでミスを防げるというのは偉大です。車両がすでに組み立てられた後でミスを見つけた場合、再度分解する必要があるのですから」。

このような動作追跡システムは、それぞれ異なる目的のためにさまざまな形で存在する。たとえばVeo Roboticsは、深度センサーを使用して作業員とロボットの正確な位置を追跡し、動的に衝突を防止している。

しかし、この産業全体での課題は「人の動きをどう追跡するか」ではなく「人の動きを追跡した結果をどのようにして簡単に展開し適用するか」である。システムの導入に1か月、再プログラムに数日かかっていては意味がないのだ。そのためInvisible AIは、コーディングの必要がなく完全にエッジベースのコンピュータービジョンを使用して、導入と管理の簡素化に重点を置いた。

「可能な限り簡単に展開できるようにするのが目標でした。コンピューティングやすべてが組み込まれたカメラを購入し、それを施設に設置し、プロセスのいくつかの例を示してから注釈を付けるだけです。想像されるよりもずっと簡単です」とダンジガー氏。「1時間足らずで稼働を開始できます」。

カメラと機械学習システムをセットアップしたら、そこからはそれほど難しい問題ではない。人間の動きを追跡する機能は、最近のスマートカメラにとってかなり簡単な作業であり、それらの動きをサンプルセットと比較することも比較的簡単だ。動画のキャプション付けや手話の解釈に特化したAIで見られるような(どちらもまだ研究コミュニティーで開発途中である)、人が何をしているのかを推測したり、ジェスチャーの膨大なライブラリーに一致させたりするなどの「創造性」は必要ない。

プライバシーに対する課題や、カメラに常時映っているという事実に不安を感じるなどの可能性については、このテクノロジーを使用する企業がしっかりと対応する必要がある。ほとんどの新しいテクノロジーと同じく、善となる可能性と同様に悪となる可能性も備えている。

Invisible AIを早い段階でパートナーとした企業の1つはトヨタだ。トヨタはアーリーアダプターではあるが、同時にAIと自動化に関して慎重派である。複数の実験の後に到達した同社の哲学は、専門労働者に力を与える、というものだ。このようなツールは、労働者らがすでに行っていることに基づき、体系的な改善を提供する良い機会である。

非情なまでの最適化のため、労働者が非人間的な割り当てを満たすように強いられるAmazonの倉庫のような場所にこのシステムが導入されるというのは簡単に想像がつく。しかしダンジガー氏によると、すでに同社と協同している企業の話では労働者自身による作業改善を促す結果となっているとのことだ。

何年もの間、来る日も来る日も製品を作り続けている従業員は正しい製造方法について深い専門的知識を持っているが、その知識を正確に伝えるのは難しい場合がある。「ボルトで締める際に自分の肘が邪魔にならないよう、こうやってパーツを持つように」とトレーニングで指示するのは簡単だが、それを身につけるのは一筋縄ではいかない。Invisible AIの姿勢と位置の検出機能は、そういったことに役立てることができる。

「個人の一連の作業に要する時間にフォーカスするのではなく、ステップの合理化や反復ストレスの回避などが見られています」とダンジガー氏。

重要なポイントは、この種の機能が、結果を送信するためのイントラネット以外に接続を必要としないコードフリーのコンパクトなデバイスで提供できるということだ。分析するためにビデオをクラウドにストリーミングする必要はなく、必要に応じてフッテージとメタデータの両方を完全にオンプレミスで保持することが可能だ。

世間の魅力的な新テクノロジーと同様に不正使用される可能性も幾分あるが、Clearview AIのような取り組みとは異なり、同製品は悪用を目的として作られたものではない。

「そこには微妙な境界線があります。同製品を導入する企業の性質を反映するでしょう」とダンジガー氏は言う。「弊社とやり取りする企業は、従業員を本当に大切にしており、彼らができるだけ尊重され、プロセスに関与することを望んでいます。そういった事には大いに役立ちます」。

360万ドル(約3億8000万円)のシードラウンドは8VCが主導し、iRobot Corporation、K9 Ventures、Sierra Ventures、Slow Venturesなどの投資家が参加している。

関連記事:いまさら聞けないコンピュータービジョン入門

Category:人工知能・AI

Tags:コンピュータービジョン 機械学習 Invisible AI

[原文へ]

(翻訳:Dragonfly)

投稿日:

タッチで操縦する宇宙船Crew Dragon、僕らはまた一歩SF映画に近づいた

革新的に進めるか、それともこれまでに実証された方法に留まるかの判断ができずしてまったく新しい宇宙船を製造することはできない。Crew Dragonの製造にあたり、SpaceX(スペースX)はボタンやダイヤルを廃止し、全面的にタッチスクリーンを採用することにした。今月後半に飛行する宇宙飛行士も長年の訓練と筋肉の記憶を取り払う必要があるが、それほど悪くないと彼らは言う。

まもなくDragonカプセル乗り込んで国際宇宙ステーションに向かう2人の宇宙飛行士、Bob Behnken(ボブ・ベンケン)氏とDoug Hurley(ダグラス・ハーリー)氏は、同宇宙船を実際に操縦する最初の2人となる。

「新品の宇宙船で飛行することができるなんて、おそらくテストパイロット学校中の生徒の夢でしょう。良い友人と共にこのような機会を得ることができて私はとても幸運です」と、NASAが放送した記者会見でベンケン氏は言う。

もちろん、彼らは万全の準備を整えて飛行に臨んでいる。シミュレーターでは無数の時間を費やし、初期の段階からSpaceXと協働で取り組んできた。

「SpaceXに出向き、さまざまな制御メカニズムを評価したのは少なくとも5〜6年前のことです」とハーリー氏。「彼らは機体をどのように操縦するべきかを検討しており、最終的にタッチスクリーンインターフェイスが選ばれました」。

「もちろん、パイロットとしての私の全キャリアの中で身につけてきた機体のコントロール方法とは確かに異なりますが、我々はとてもオープンマインドな心持ちで取り組んだと思います。機体を正確に飛ばし、誤って触れたり間違った入力をしたりしないようにするため、彼らと協力して調和方法、つまり自分のタッチを実際にディスプレイと結び付ける方法を定義しました」。

同記事のトップの写真と以下の写真を比較してほしい。以下は宇宙飛行士がロシアのSoyuzカプセルの操縦を学ぶための物理シミュレーターの写真だ。

従来の操縦室

どちらも正直、足まわりのスペースがゆったりしているとは言えない

もちろん最新の航空機であってもいまだ非常に多くの物理的な制御装置が装備されている。パイロットは慣れているだろうが、設計は間違いなく古いと言える。

ベンケン氏によると、これらの宇宙船は、ISSに行きドッキングするという特定の目的を念頭に置いて作られている。この機体で火星に行くわけではないため、その事実が設計と操縦方法に影響しているのだ。

「この飛行タスクは非常にユニークなものです。宇宙ステーションに近づき、近接して飛行し、その後ゆっくりと接触。これはおそらくスペースシャトルや航空機の飛行で通常見られるものとは少し異なります」とベンケン氏は控えめな表現を用いて言う(実際は夜と昼ほどの明確な違いがある)。「タッチスクリーンインターフェイスを審査した際、我々は実際に目下のタスクに焦点を当て、この特定のタスクにおいて優れたパフォーマンスを発揮できるよう努めました」。

プロトタイプのCrew DragonはすでにISSに打ち上げられ帰還している。自律的かつ遠隔的に操縦されたものだ。

「我々にとっても彼らにとっても、当初はこういったさまざまな設計上の問題に取り組むことには困難がつきまといましたが、タッチスクリーンを用いた手動飛行の観点からすると、機体は非常にうまく飛ぶようになりました」とハーリー氏。

「違いとしては、スティックを使用する場合と比較して入力を行う際は非常に慎重に行う必要があるということです。たとえば飛行機を操縦している場合、スティックを前に押すと機体は下に下がります。タッチスクリーンで実際にそれを行うためには、スクリーンと私が調和しなければなりません」。

「タッチスクリーンへの切り替えが必ずしもすべての飛行タスクに適しているとは、私は思っていません」とベンケン氏。「しかし今回のタスクでISS近くまで安全に飛行するためには、タッチスクリーンが十分な機能を果たしてくれると思っています」。

ハーリー氏によると、操縦のための機構と読み出された情報がすべて同じ場所にあることは大きな利点だと言う。「たとえば、機体を飛ばすために見ているのと同じ場所に、ドッキングターゲットが表示されています。なのでこれまでとは少し異なる方法ですが、このデザインは全体的に非常にうまく機能しています」。

しかし、シミュレーターで学べることは限られている。この最初の有人飛行はまだテスト段階であり、カプセルの次のバージョンを完成させるには今回からのフィードバックが必要だ。結局のところ、数十年前に遡るシステム上で20もの異なるノブのポットを再配線するよりも、ソフトウェアの更新をプッシュする方が簡単なのだ。

「我々はこのテスト飛行の一部を担う者として、飛行前の段階や宇宙ステーション付近でも機体の実際の手動飛行能力をテストできるように設計しました」とハーリー氏は説明する。「期待どおりに作動するか、シミュレーターで見せた飛行通りかを確認するためです。将来の飛行士が手動で宇宙船を飛ばす必要が生じた場合に備え、飛行テストでは他の事項同様に用意周到でなければなりません。つまり、Crew Dragonのさまざまな機能をすべてテストするために、我々がやれることをすべてやっているわけです」。

すべてが計画どおりに進んだ場合、今月後半に飛行予定のCrew Dragonの同バージョンについて、今後さらなるニュースを耳にできることだろう。差し当たって、著者はSpaceXとNASAの両方に、制御方式とその開発に関する詳細情報を求めておいた。

関連記事:

Category:宇宙

Tags:Crew Dragon SpaceX 宇宙船

[原文へ]

(翻訳:Dragonfly)

投稿日:

米国議会図書館が機械学習で300年ぶんの新聞の画像を抽出し検索可能に

昔の事件や人々に関する記録に関心のある歴史家たちは、かつては古い新聞の目録カードをかき分けていたが、次にマイクロフィルムをスキャンするようになり、やがてデジタルリストを検索するようになった。だが現代の技術は、個々の単語や写真に至るまで索引化を可能にした。米国議会図書館では、最新鋭の機械学習を使って1何世紀も前からの新聞記事の写真やイラストをデジタル化し分類する取り組みを進めている。

同図書館の「招聘イノベーター」の座を獲得したワシントン大学研究員であるBen Lee(ベン・リー)氏が主導するプロジェクトNewspaper Navigator(ニューズペーパー・ナビゲーター)では、アメリカの歴史に残る1600万ページぶんを超える新聞の画像を収集しデータを抽出している。

リー氏とその仲間は、昔の新聞や印刷物のデジタル化で先行しているChronicling America(クロニクリング・アメリカ)の仕事に刺激を受けた。Chronicling Americaは新聞のあらゆる内容を光学文字認識(OCR)でスキャンしているが、これはクラウドソース・プロジェクトでもあるため、さらなる分析のための画像の特定や切り出しは人の手が必要だ。ボランティアの作業員は、第一次世界大戦に関係する画像を枠で囲んで説明文を書き写し、画像を分類している。

この限定的な取り組みを見て、リー氏のチームは考えた。「印刷物の画像の特性を生かすものとして、私はそれが大好きでした。そのプロジェクトから生まれた内容の視覚的多様性を見て、純粋に素晴らしいと感じ、米国中の新聞記事を対象にこのような内容を記録できたらどうだろうかと考えたのです」とリー氏はTechCrunchに語った。

彼はまた、ボランティアが作り出したものが、実は機械学習システムのトレーニング用データとして最適であることに気がついた。「これを使ってオブジェクト検出モデルを構築し、あらゆる新聞紙面を読み込ませれば、宝の箱を開けることはできないかと私は自問しました」。

うれしいことに、答えはイエスだった。最初の人力による画像と説明文の切り出し作業を利用し,彼らは、それを自力で行えるAIエージェントを構築した。普通に微調整や最適化のあと、彼らはChronicling Americaがスキャンした新聞記事の完全なデータベースの中にそれを解き放った。

上段左から、画像をダウンロードしてMETS/ALTOでOCR、視覚コンテンツ認識を実行、視覚コンテンツの切り出しと保存、画像埋め込みの生成。下段左から、OCR、予測された境界ボックスからOCRを抽出、抽出されたメタデータをJSON形式で保存

「19日間ノンストップで稼働しました。私が経験した中で最大のジョブです」とリー氏。しかし、結果は驚くべきものだった。3世紀(1789年から1963年)にわたる無数の画像が、それらに本来付属していた説明文から抽出されたメタデータとともに分類されたのだ。この処理が解説されている研究論文は、ここで読める。

説明文が正しいと仮定すると、これらの画像(つい最近までアーカイブを日付ごとに追いかけ、文章をひとつひとつ読んで、片っ端から調べなければ見ることができなかったもの)は、他の言語資料と同じように内容で検索できるようになる。

1870年の米国大統領の写真を探したいなら、もう狙いをつけて何十ページもの新聞を読みあさり写真の説明文の内容を何度も確かめる必要はなく、Newspaper Navigatorで「president 1870」と検索すれば済む。または、第二次世界大戦時代の風刺漫画を見たいなら、日付の範囲を指定するだけで、すべてのイラストが入手できる(彼らはすでに写真を年別のパッケージにまとめていて、その他のコレクションもそうする予定だ)。

下にいくつかの新聞紙面の例を示す。機械学習システムが切り出した枠が重ねられている(注意:帽子の広告が山ほどあり、差別的な内容も含まれる)。

  1. newsnav-examples-4

  2. newsnav-examples-3

  3. newsnav-examples-2

  4. newsnav-examples-1

  5. newsnav-examples-5

少しの間、気楽に眺めるのも楽しいが、重要なのは、これが研究者たち(そしてその他の資料一式)に何をもたらすかだ。研究チームは本日、このデータセットとツールの公開を記念して、データの利用法のアイデアを競うイベントを開催する予定だ。新しい使い道の発見と実用化の方法が得られればと彼らは期待している。

「このデータセットの創造的な利用法をみんなで考える、素晴らしい催しになればと考えています」とリー氏。「機械学習という観点から私が心底ときめいたのは、人々が独自のデータセットを作れるユーザーインターフェイスを構築するというアイデアです。風刺漫画やファッション広告など、自分の興味に応じてユーザー自身が定義し、それに基づいて分類器のトレーニングができるインターフェイスです」。

南北戦争時代の地図を要求したことを想定した検出例。

視点を変えれば、Newspaper NavigatorのAIエージェントは、その他のコレクションのスキャンやデジタル化に使える、より具体的な内容のエージェントの親になることができる。これは実際、米国議会図書館で計画されていることだ。デジタルコレクションの担当チームはNewspaper Navigatorがもたらした可能性と機械学習全般を、おおいに歓迎している。

「私たちが興味を抱いていることのひとつに、私たちが使える検索や発見の手段をコンピューターが拡大してくれる可能性があります」と米国議会図書館デジタル戦略ディレクターのKate Zwaard(ケイト・ツワード)氏は語る。OCRのおかげで、それなしに探せば何週間も何カ月もかかったであろうものが見つけられるようになりました。図書館の蔵書には、美しい図版やイラストが掲載されたものが数多くあります。しかし、たとえば聖母子像にはどんなものがあったかを知りたいとき、一部は分類されていますが、その他のものは本の中にあって分類されていません」。

その問題は、画像と説明文を結びつけるAIが体系的に本を熟読することで、早々に解決できる。

Newspaper Navigatorを構成するコード、画像、そしてそれが生み出した結果のすべては、完全なパブリックドメインとして、目的にかかわらず無料で利用でき、改変もできる。コードは同プロジェクトのGitHubで入手可能だ。

画像クレジット:Library of Congress

[原文へ]

投稿日:

大量の「いいね!」とコメントでインスタを欺く「ポッド」との戦い

ニューヨーク大学(NYU)の研究チームは、Instagramのアルゴリズムを操って露出を高めるために「いいね!」やコメントを組織的に交換するInstagramユーザーグループ(中にはメンバーが数千人になるものもある)を何百個も特定した。さらに同チームは、その研究の一環として、Instagramの投稿にこの手法が使われているかどうかを判断する機械学習モデルのトレーニングも行った。

「ポッド」と呼ばれるこの手法によるアクティビティは、厳密には本物のエンゲージメントとはいえないが、かといって偽のエンゲージメントとも断定できないため、検知や対抗措置の実施が難しい。また、以前は危険度が比較的低いと考えられていたが(偽アカウントやボット使用の問題と比べれば今でも確かに低い)、現在はその規模も影響力も拡大している。

インターネットで検索するとポッドは簡単に見つかる。誰でも参加可能なポッドもある。ポッドの結成場所として最も広く利用されているのはTelegramである。おおむね安全で、チャンネル加入人数に制限がないためだ。ポッド参加メンバーがInstagramに投稿してそのリンクをポッドで共有すると、同じポッドに参加する他のメンバーが「いいね!」やコメントを付ける。すると、その投稿がInstagramの「おすすめ」選定アルゴリズムによって拡散される可能性がはるかに高くなり、オーガニックなエンゲージメントが促進される、という仕組みだ。

互酬性のサービス化

グループのメンバーがお互いの投稿に「いいね!」を付け合う行為は、互酬性の乱用と呼ばれる。ソーシャルネットワークの運用会社もその存在を十分認識しており、この手のアクティビティを削除したことがある。しかし、NYUのTandon School of Engieeringの研究チームによると、この手法が研究されたり詳細に定義されたりしたことはないという。

今回の研究論文の主執筆者であるRachel Greenstadt(レイチェル・グリーンシュタット)氏は、「Instagramはこれまで、他者へのログイン情報提供などの自動化による脅威やボット被害に重点を置いていたのだと思う。我々がポッドを研究したのは、ポッド問題の深刻さが増しており、他の問題に比べて対抗措置を講じるのが難しいためだ」と説明している。

規模が小さければそれほど大きな問題にはならないように感じられるが、同チームの研究ではポッドによって操作された投稿が約200万件、ポッドに参加しているユーザーが10万人以上見つかった。さらに、これは公開されているデータを使って閲覧できる英語表示の投稿のみを調査した結果である。この研究論文はThe World Wide Web Conferenceの発表論文集に掲載された(ここから閲覧可能だ)。

重要なのは、このような互酬的な「いいね!」の付け合いには、形だけのエンゲージメントを増やす以上の効果があるという点である。ポッドに参加している投稿には多数の「いいね!」やコメントが付いたが、これは作為的なエンゲージメントだった。しかしその結果、Instagramのアルゴリズムがだまされてそのような投稿を優先表示するようになり、ポッドに参加していない投稿のエンゲージメントでさえも大幅に増加したのだ。

コメントを求められたInstagramは当初、このような行為は「Instagramのポリシーに違反しており、阻止するために数多くの措置を講じている」と回答し、今回の研究はNYUの研究チームとInstagramの共同研究ではないと述べた。

しかし実際のところ、NYUの研究チームは今回の研究プロジェクトの初期段階からInstagramの不正防止担当チームと接触していた。さらにこの研究結果を見る限り、Instagramがどのような措置を講じているにしろ、少なくともポッド問題に関しては思うような効果が出ていないことは明らかだ。筆者はInstagramの担当者に対してこの点を指摘した。何らかの回答があったら、この記事に追記する予定だ。

ポッド使用は「グレーゾーン」

とはいえ、ポッド禁止に向けてすぐに行動を起こせばよい、というわけでもない。ポッドによるアクティビティは多くの点で、友達同士あるいは興味が似ているユーザー同士がお互いの投稿にリアクションを返すという、Instagramが本来の使い方として意図しているアクティビティと同じだからだ。さらに、ポッド使用が不正行為であると簡単に決めつけられるわけでもない。

グリーンシュタット氏は次のように述べている。「ポッド使用はグレーゾーンで、判断が難しい。Instagramユーザーもそう考えていると思う。どこまでが許容範囲なのか。例えば記事を書いてソーシャルメディアに投稿し、そのリンクを友だちに送ると、その友だちが投稿に『いいね!』を付けてくれる。友だちが記事を書いて投稿したら、今度は自分が同じことをする。これはポッド行為になるのか。お互いに『いいね!』を付けることが問題であるとは必ずしもいえない。コンテンツの拡散・非拡散を判断する上でそのようなアクションをアルゴリズムがどう処理するべきか、ということが問題だ」。

そのような行為を何千人ものユーザーを使って組織的に行い、(一部のポッドグループで行われているように)ポッド参加メンバーに課金まですれば、明らかに不正行為になる。しかし、この線引きは簡単ではない。

それよりも肝心なのは、何をもってポッド行為とするかを定義しなければ線引きすらできない、という点である。今回の研究では、ポッド投稿と通常投稿の「いいね!」とコメントのパターンに見られる違いを精査することにより、ポッド行為の定義が行われた。

「ポッド投稿と通常投稿では、言葉の選択とタイミングのパターンに特徴の違いが見られる」と共同執筆者のJanith Weerasinghe(ジャニス・ウィーラシンゲ)氏は説明している。

容易に想像できることがだが、あまり興味のない投稿にコメントするよう強制されたユーザーは、内容に踏み込んだコメントはせず、「いい写真」とか「すごい」といった一般的な言葉でコメントする傾向がある。ヴィーラシンゲ氏によると、そのようなコメントを禁止しているポッドグループもあるにはあるが、多くはないとのことである。

ポッド投稿で使用される言葉の一覧を見ると、予想通り、フォロワーが多い投稿のコメント欄でよく目にする言葉ばかりだ。とはいえ、このことはInstagramのコメント欄では何といっても全般的に表現の幅が限られることを証明しているのかもしれない。

ポッドで多用される言葉

しかし、何千件ものポッド投稿と通常投稿を統計的に分析した結果、ポッド投稿では「一般的な表現を使った支持」コメントの割合が圧倒的に高く、しばしば予測可能なパターンで出現していることがわかった。

さらに、この分析データを基に機械学習モデルのトレーニングを行い、初見の投稿の中から最高90%の高精度でポッド投稿を特定することに成功した。この方法を使えば次々とポッドを発見できるかもしれないが、それらは氷山の一角にすぎないことを忘れてはならない。

グリーンシュタット氏は「今回の研究期間に、アクセスと発見が容易なポッドをかなりの数、特定できた。しかし今回、ポッド全体の大半を占め、小規模ながら高い利益を生み出してしているポッドを特定することができなかった。そのようなポッドには、ソーシャルメディアにおいて既にある程度の露出実績があるユーザー、つまりインフルエンサーでないと参加できないためだ。我々はインフルエンサーではないため、そのようなポッドに実際に参加して調査することはできなかった」と説明している。

ポッドと、ポッドによって操作された投稿の数はここ2年間で着実に増加している。2017年3月には7000件のポッド投稿が発見されたが、1年後には5万5000件近くまで急増した。2019年3月には10万件を超え、その数は今回の研究データの収集が終わる時点でも増え続けていた。現在、ポッドによる投稿は1日あたり4000回を超えているといっても過言ではなく、それぞれの投稿が、作為的にもオーガニックにも膨大な数のエンゲージメントを獲得している。現在、1つのポッドの参加メンバー数は平均900人で、中には1万人を超える参加メンバーを抱えるポッドもある。

「数人の研究者が、公開されているAPIとGoogleを使ってこのような発見をできたのであれば、なぜInstagramは今まで気づかなかったのか」と思う読者もいるかもしれない。

先ほども触れたが、Instagramは単にポッドを大きな脅威として認識していなかったために、それを阻止するポリシーやツールの開発を進めてこなかっただけなのかもしれない。「偽の『いいね!』、フォロー、コメントを生成するサードパーティ製のアプリやサービス」の使用を禁止するというInstagramのルールがこのようなポッドには適用されないことはほぼ確実だ。なぜならポッド行為は多くの点で、ユーザー間のまったく正当なやり取りと同じだからだ(ただし、Instagramはポッドがルール違反であると明言している)。また、偽アカウントやボットの方がはるかに大きい脅威であることも確かである。

さらに、ポッドが国家による意図的な虚偽情報拡散やその他の政治的な目的で利用される可能性もあることにはあるが、今回の研究中にその種のアクティビティは(それを具体的に探すことはしなかったが)発見されなかった。そのため、現在のところポッドの危険度は依然として比較的低いといえる。

とはいえ、ポッド行為の定義と検知に役立つデータをInstagramが持っていることは明らかであり、そのデータに基づいてポリシーやアルゴリズムを変更することも可能なはずだ。NYUの研究者たちは喜んで協力するだろう。

関連記事:あなたのインスタストーリーが知らないロシア人に見られているワケ

Category:ネットサービス

Tags:Instagram 機械学習 SNS

[原文へ]

(翻訳:Dragonfly)

投稿日:

Googleの失敗から学ぶ、AIツールを医療現場へ適用することの難しさ

AIによる医療分野での魔術的な活躍がよく話題になる。機械学習モデルがまるで専門家のように問題を検出するスクリーニングという分野では、特にそれが言えるだろう。しかし、多くの技術と同じように、試験所でうまくいくことと、実社会で機能することは全く話が違う。Googleの研究者たちは、タイの田舎で行われた診療所でのテストを通じ、その厳しい事実を見せつけられた。

Google Healthは、目の画像を処理し、世界中で視力喪失の主な要因となっている糖尿病網膜症の兆候を見つける深層学習システムを開発した。しかし理論的な正しさとは裏腹に、同ツールは実際の現場テストで実用に向かないことが判明した。結果が安定せず、また現場の診療方法とうまく調和しないため、患者と看護師の両方が不満を訴えている。

ここではっきりさせておくべきことは、得られた結果は苦いものだったとはいえ、この種のテストを行うためには必要不可欠で、かつ道義性のある段階を踏んでいたという点である。また、Googleが体裁の悪い結果を公表したことは評価に値する。さらに、同社の文書を読む限り、担当チームが結果を肝に銘じていることは明らかである(ただし、ブログ記事では実際の経緯をやや楽観的に描いてはいる)。

研究報告では、タイにある数箇所の診療所で、糖尿病網膜症(DR)患者を選別する既存の手順を強化するためのツールの使用経緯が記録されている。既存の手順を手短に説明すると、看護師は糖尿病患者に1名ずつ対応し、目の画像(眼底写真)を撮影し、画像を検査して結果を報告する眼科医へまとめて送付する。患者数が多いため、通常は結果が得られるまで4~5週間かかる。

Googleシステムは、わずか数秒で眼科医レベルの専門作業を完了させる目的で開発された。社内テストでは、90%の精度でDRの度合いを判定している。これで、看護師は病院を紹介して推薦したり、さらなる検査を行う決定を1か月ではなく1分で行えることになる(自動判定は1週間以内に眼科医によってグランドトゥルース検証された)。見事な結果だ-理論的には。

目の画像(眼底写真)

理想的には、同システムはこのような結果を素早く返し、患者も確認できる

しかし、この理論は報告の著者たちが現場へ適用するやいなや、崩壊してしまった。報告には次の通り記載されている。

今回の研究では、11箇所の診療所において、目のスクリーニングプロセスをできるだけ多様に観察した。画像を取得してグレードを判定するプロセスはどの診療所でも同じである。しかし、看護師はスクリーニングのワークフロー構成において大きな自主性を持っており、また、診療所ごとに利用可能なリソースも異なっていた。

目のスクリーニングを行う環境や場所も、診療所に応じて大きく異った。高品質の眼底写真を撮影できるように、周囲を暗くして患者の瞳孔が十分に大きく映すための専用の選別室を設置した診療所は、わずか2箇所にとどまった。

環境条件とプロセスがばらばらであったため、サーバーへ送信された画像もアルゴリズムで要求される高いレベルを満たしていなかった。

この深層学習システムでは検査対象の画像が厳格な基準を満たす必要がある…画像にわずかなぼやけや暗い箇所があれば、明確に発症予測できる場合でも、システムは画像を拒否する。診療所の制約下で繰返し作業する看護師が撮影した画像の一貫性や品質は、システムが要求する高い画質を満足させなかった。このため不満が高まり、仕事量が増加した。

DRの症状を明らかに示しても画質の低い画像はシステムに拒否されるため、手順が混乱し、長引くこととなった。しかし、そもそもシステムへ画像をアップロードできなければ、こうした問題点を扱うことすらできない。

インターネット接続が良好であれば、結果は数秒で表示される。しかし、今回の研究に参加した診療所のインターネット接続は、遅くて不安定な場合が多々あった。このため、画像によってはアップロードに60~90秒かかり、スクリーニングの待ち時間が伸び、1日で処理できる患者数が減ることとなった。ある診療所では、目のスクリーニング中に2時間程度インターネット接続が途切れたため、選別した患者数は予定された200名からわずか100名へ下がった。

「最低限、危害は出ない」原則を思い出す必要があるだろう。新テクノロジーを活用する試みのおかげで、治療を受けられる患者数がかえって減ってしまった。看護師は様々な方法で埋め合わせようとしたが、画像の不安定さやその他の原因が重なり、患者に対して研究に参加しないよう勧める結果となった。

うまくいったケースでも、不慮の事態が発生している。患者は、画像送信後ただちに検査が行われて、次回の診察予約を行う準備ができていなかった。

今回の研究は、前向き研究(プロスペクティブスタディ)として設計されているため、紹介先の病院を訪れる予定をその場で立てなければならない。そのため、第4および第5診療所では、看護師は不要な面倒が増えないように、患者に対して前向き研究に参加しないよう勧告していた。

また、ある看護師はこう述べている。

「(患者)は検査の正確さではなく、その後何をしなければいけないのかを心配しているのだ。結果的に病院へ行かなければいけないのなら、診療所で検査するのは無駄なのではないかという疑問が浮かんでいる。私は患者に対し、「病院へ行く必要はない」と安心させる。彼らはまた、「もっと時間がかかるか?」「別の場所へ行かなければいけないのか?」とも聞く。出かけることができないため、研究にそもそも参加しない人もいる。40~50%の人は、病院へ行かなければいけないと考えて、研究に参加しない。」

もちろん、悪いニュースばかりではない。問題は、混みあったタイの診療所ではAIが何の役にも立たないことではない。課題と場所にソリューションをぴったり合わせなければいけないことだ。わかりやすい瞬間的な自動検査は、うまくいっている間は患者と看護師の両方から歓迎された。時には、目のスクリーニングという行為自体が緊急に対策が必要な深刻なケースを自覚させることに役立っている。当然のごとく、著しく制限されたリソース(現場の眼科医)への依存を減らすという主なメリットは、医療現場の状況を変革させる可能性がある。

しかし、今回のレポートを読む限り、GoogleのチームはこのAIシステムを時期尚早かつ部分的にのみ適用してしまった結果を真摯に受け止めているように見える。彼らはこう述べている。

新たな技術を導入したとき、企画担当者、政策立案者、技術設計者は、複雑な医療プログラムで起こる問題は流動的かつ緊急的であることを考慮していなかった。私たちは、人々のモチベーション、価値観、職業上の信念、そして仕事を形成する現行の規則と繰返し作業など、それぞれの都合を考慮することが、技術の導入を企画する際に不可欠であると考える。

この研究レポートは、AIツールが医療環境でどう効果を発揮するかを解説しており、また技術面の問題や技術を活用する人々が直面する問題の両方を理解できるため、十分に読む価値のある入門書だ。

関連記事:AIとビッグデータが新型コロナとの戦いで奇跡を起こすことはない

Category:ヘルステック 人工知能・AI

Tags:Google Google Heath 機械学習

[原文へ]

(翻訳:Dragonfly)

投稿日:

電子たばこの使用習慣データを収集するデバイス「PuffPacket」

電子たばこは論争の的になっている習慣だ。明らかにマイナス面がある。しかし、裏付けに乏しいがすばらしい禁煙補助品でもある。つまりどんな人が、いつ、どれくらい利用するのか、その他詳細を行動科学者がさらに把握するまで、電子たばこの使用は謎のままということになる。そこでPuffPacketの登場だ。

コーネル大学のエンジニアがデザインしたPuffPacket(パフパケット)は、電子たばこに取り付ける小さなデバイスで、使用を正確に測定し、後にユーザーや研究者が使用状況を確認できるよう情報をスマホのアプリに送信する。

一部の電子たばこデバイスには既に似たようなものがセットされている。カートリッジが少なくなっていることや、一定の使用量に達したことをユーザーに知らせるためだ。しかし一般に、電子たばこの習慣を研究するときは、専用のアプリではなくユーザーの自己申告に頼っている。

「電子たばこの使用習慣を継続して客観的に理解する手段がなく、PuffPacketの開発に至った。PuffPacketは電子たばこ使用の適切な測定、モニタリング、追跡、記録ができる。ユーザーの位置や行動のデータと自己申告から推論するものではない」と開発を主導した博士課程の学生Alexander Adams(アレクサンダー・アダムス)氏はコーネル大学のニュースリリースで述べた。

PuffPacketはマウスピースとヒーティング部分の間に取り付けるもので、さまざまな電子たばこデバイスで使える。ユーザーが息を吸うと電子たばこのサーキットがオンになるが、同時にPuffPacketもオンになる。ボルテージをチェックすることで、PuffPacketはどれくらいの液体が蒸発しているのかを把握でき、使用時間やタイミングといったよりシンプルなこともわかる。

ロケーションやアクティビティがいかに電子たばこの使用とつながっているのかを示すリアルデータの例。

データはBluetooth経由でスマホに送信される。そこにユーザーのロケーションや活動、その他のメタデータといった情報が加わる。これは午後ではなく午前中に歩いているときに、あるいは食事の後ではなくコーヒーの後に、または家よりもバーで頻繁に電子たばこを使用する、といった種のパターン特定につながる。おそらく(正当な許可があれば)特定のアプリの使用も追跡できる。Instagramと電子たばこ、 ゲームの後の一服など。

こうしたパターンの一部は明白かもしれないし、他のパターンはそうではないかもしれない。しかしいずれにしても使用についてユーザーに尋ねるよりリアルデータを入手するのに役立つ。ユーザーは自身の習慣について知らなかったり理解していなかったりするかもしれないし、あるいは認めようとするかもしれない。

「いつ、どこで、どんな行動を取りながらという要素の関連を調べることは中毒性を調べる上で重要だ。研究では、いつも通る道を遠ざけることができれば、習慣をなくせることが明らかになった」とアダム氏は話している。

人々が自発的に電子たばこのスティックにデバイスをくっつけて情報を共有するとは誰も考えていない。しかしオープンソースとして公開されるデザインは、研究者らがより本格的な研究を行うのに活用できる。PuffPacketについての詳細はここで閲覧できる。

<画像クレジット: Tegra Stone Nuess / Getty Images

[原文へ]

(翻訳:Mizoguchi

投稿日:

OpenAIの新たな音楽活動はエルビスの不気味の谷に入った

AIが音楽を作るという新分野は大変に興味深いが、潤沢な資金を誇る研究団体OpenAI(オープンエーアイ)は、エルビスや2パックなどのアーティストのスタイルを真似てAIに歌を作らせるという、未踏の高みに到達した。作品はそれらしく聞こえるが、音楽の「不気味の谷」に突き落とされる気持ち悪さもある。まあまあの出来だが、酒に酔ってドラッグでぼやけた頭でカラオケを聞いているような感じがする。

OpenAIが開発した新しい音楽制作システムJukebox(ジュークボックス)は、米国時間4月30日に公開されたブログ記事と研究論文に詳細が記されている。OpenAIは、ちょうど1年前にMuseNet(ミューズネット)という面白いシステムを披露している。MIDI形式の楽曲を大量に採り込んだ機械学習システムで、ジャンルや楽器のミキシングやマッチングができるというものだ。

関連記事:バッハからジャズまでオリジナル曲を瞬時に作るMuseNet

しかし、複雑な和声や音声によってでははなく、個別の音階と打鍵情報のみで構成されるMIDIは、本物の楽器を演奏して最終的に録音される音楽よりもデータとしては単純なものだ。

クラシックのピアノ曲をAIに理解させようとすれば、音のタイミングや打鍵の情報は、無数にある要素のほんの一部に過ぎない。実際の演奏を録音した音声は、1秒間に(通常は)4万4100サンプルと、もっとずっと濃密だ。

楽器の音や声を学習し模倣する機械学習システムは、直前の言葉や音に注目して、その先の数ステップを予測する仕組みになっている。だが、一般にそれらが処理できるデータは数十から数百のオーダーだ。たとえば直前の30個の言葉または音から、次の30個がどうなるかを予測する。となるとコンピューターは、10秒間の波形のほんの一部から抽出した44万サンプルから、90秒400万サンプルを使った場合と同程度の歌を作るには、どうしたらいいのだろうか。

OpenAIの答は、歌をもっと理解しやすい部分に切り分けることだった。音程や和音というよりは、そのようなもの、つまりコンピューターが扱いやすい1/128秒間の要約を、2048種類の「語彙」から拾い出すというものだ。正直言って、うまい例えが見つからない。なんとか理解できる範囲で考えても、人間の記憶や理解の方法とはまったく異なっているからだ。

(上)生の音声:1秒間に4万4100サンプル。各サンプルは、その瞬間のサウンドの振幅の代理となる浮動小数点数、(中)折り畳みニューラルネットワークを使用してエンコード、(下)圧縮された音声:1秒間に344サンプル。各サンプルは候補となる2048の語彙トークンのひとつ。実際に色分けされているわけではなく、あくまで波形の区切りを図解している

その結果、AIエージェントは、追跡するトラックの数が多すぎない程度に大きく、それでいて歌の音声を確実に再構築するのに最低限必要な程度に小さい、自分で理解しやすい部品に安定的に切り分ける方法を獲得した。実際は、ここで説明したよりもずっと複雑な処理が行われている。歌をひとつながりの「言葉」に確実に分解し、そこから歌を再構築するというのが、この研究の肝なのだが、技術的な詳細については、OpenAIの論文を参照してほしい

またこのシステムでは、歌詞の意味を解析する必要もある。この分野のその他ほとんどの要素と変わりなく、これも話で聞くよりずっと複雑だ。人がボーカルのパターンを記憶し利用する能力は、生まれつき備わっているものと、後から学習したものとがある。我々は当たり前に思っているが、大変に高度な力なのだ。コンピューターにはそのような能力が備わっていないため、音が混ざり合う中から人の声を聞き分け、何を言っているのかを理解し、単なる言葉の羅列である歌詞と照合する。音階やテンポといったその他の要素に関する情報は、そこには一切含まれない。それにも関わらず、OpenAIのシステムは、その作業で満足のいく結果を出している。

Jukeboxは、音楽に関するさまざまな仕事を熟すことができる。その結果は歌と呼べる代物にはなっていないかも知れないが、現在、このようなシステムはこれ以外には存在せず、一から歌を再構築して、目標とするアーティストに似ていると感じさせるまでになっていることを理解して欲しい。120万曲を使ってトレーニングを行ったこのシステムは、最終的には多面的な能力を身につけ、基本的に、与えられた歌詞と、目標とするアーティストのその他の要素を取り込んで学習したスタイルから即興で歌を作ることが可能になった。

そのため、エラ・フィッツジェラルドがどのように歌うか、楽器は彼女の歌とどう絡んでくるかという知識から、「アット・ロング・ラスト・ラブ」を彼女らしく、しかし作者のコール・ポーターが想定していたものとはまったく違うであろうスタイルで歌い上げる(この歌と他の歌のサンプルのリンクは、OpenAIのブログ記事の上の方にある)。

Jukeboxはまた、完全にオリジナルの歌詞を誰かのスタイルで歌うこともできる。別のAI言語モデルが作った「Mitosis」(有糸分裂)という歌詞をエルビスが歌った例はかなり奇妙だ。

聞き取れなかった人のために歌詞を書いておこう。

From dust we came with humble start;
From dirt to lipid to cell to heart.
With [mitosis] with [meiosis] with time,
At last we woke up with a mind.
From dust we came with friendly help;
From dirt to tube to chip to rack.
With S. G. D. with recurrence with compute,
At last we woke up with a soul.

我々は塵から慎ましく始まった
土から液体から細胞から心臓へ
[有糸分裂]と[減数分裂]と時間をかけて
ついに我々は心と目覚めた
塵から優しい助けを借りて我々は生まれた
土から管からチップからラックへ
SGDと再現と演算で
ついに我々は魂と目覚めた

たしかにエルビスだ。いかにもAIらしく、細胞分裂を人生のメタファーに使っている。なんて時代だ。

最後に、Jukeboxは「仕上げ」作業を行う。ライブラリーで行った基礎学習に加え、歌の最初の12秒を学習して、それを元に残りの部分を同様のスタイルで作ってゆく。オリジナルからAIが生成した歌へ切り替わる部分は、エーテルをぶち込まれた感じだ。

MuseNetは、それほど複雑ではないため、ほぼリアルタイムで曲を演奏できた。しかしJukeboxは膨大な演算を必要とするため、曲の1秒分を作るのに数時間かかる。「私たちは、異なるジャンルの10人のミュージシャンを最初のセットとしてJukeboxに教えました。これらのミュージシャンは、創造的作業に向いているとはすぐに自覚できませんでした」と論文の著者は皮肉っている。それでも、これはとても楽しくて魅力的な研究だ。これまでの流れからすると、来年の4月には、さらに進化したOpenAIの音楽活動が期待できる。

画像クレジット:alengo / Getty Images under a RF license

[原文へ]

(翻訳:金井哲夫)

投稿日:

UCバークレー発祥のDetermined AIが機械学習インフラをオープンソースに

機械学習は、ニッチな分野から無数にあるソフトウェアスタックの重要なコンポーネントへと急速に移行したが、だからといって簡単に手がつけられるわけではない。機械学習の開発と管理管理に必要なツールは企業グレードで、多くの場合企業だけを相手にしている。だがDetermined AIは、同社のAIインフラストラクチャ製品全体をオープンソース化することで、これまで以上に使いやすくすることを狙っている。

同社は、組織化された信頼性の高い方法でAIを開発するための「Determined Training Platform」を開発した。これは大企業が自分たちのために作って(秘匿している)ものと似たようなものだと、同社は昨年1100万ドル(約12億円)のシリーズA調達を行った際に説明した。

「機械学習は、今後のソフトウェア開発方法の中の大きな部分を占めることになります。しかし、GoogleやAmazonのような企業が生産性を確保するためには、こうしたソフトウェアインフラをすべて自前で構築しなければなりませんでした」とCEOのEvan Sparks(エバン・スパークス)氏は述べている。「私たちが働いていたある会社では、70人がAIのための内部ツールを構築していました。このような取り組みを続けられる企業は、地球上にそれほど多くありません」。

小規模な企業では、学術的な仕事や個人研究を目的としたツールを使って、小規模なチームによる機械学習(ML)の実験が行われている。実際の製品を開発している何十人ものエンジニアに向けてそれを拡大するには…多くのオプションは残されていない。

「そうした人たちはTensorFlowやPyTorchのようなものを利用しています」と語るのは、チーフサイエンティストのAmeet Talwalkar(アミート・タルウォーカー)氏だ。「仕事のやり方の多くは決まったやり方です。例えば、モデルはどのように訓練されるのか?どこにデータを書き留めればベストなのか?データを適切な形式に変換するにはどうすれば良いのか?これらはすべて、極めて基本的な作業なのです。それを行う技術はありますが、まだまだ開拓途上なのです。そして、それを準備するためにしなければならない仕事の量たるや。大規模なハイテク企業がこれらの内部インフラを構築するのには相応の理由があるのです」。

カリフォルニア大学バークレー校のAmpLab(Apache Sparkの本拠地)からスタートしたDetermined AIは、数年前からそのプラットフォームを開発し、有料の顧客からのフィードバックと検証を受けてきた。そして今彼らは、オープンソースデビューの準備が整ったと言う。もちろん、Apache 2.0ライセンスを使ってだ。

「私たちは、それを選んだ人たちが、あまり多くの助けがなくても、自分自身でそれを使うことができると確信しています」とスパークス氏は言う。

ローカルまたはクラウドのハードウェアを使用して、プラットフォームを自分でホストして、インストールすることもできるが、最も簡単な方法は、AWSやお好みの場所から自動的にリソースを供給して、不要になったら破棄できる、クラウドマネージドバージョンを使うことだろう。

Determined AIプラットフォームが、多くの小規模企業が同意できる基礎レイヤーのようなものになり、結果や標準への移植性が提供されることで、すべての企業やプロジェクトをゼロから始める必要がなくなることが期待される。

今後数年間で機械学習による開発が桁違いに拡大すると予想される中、パイのほんの一部に対してでも取り分を主張する価値はあるが、もし運が良ければ、Determined AIは中小企業にとってAI開発の新たなデファクトスタンダードになるかもしれない。

このプラットフォームは、GitHubまたはDetermined AIの開発者サイトで確認できる。

画像クレジット:Getty Images

原文へ

(翻訳:sako)

投稿日:

Facebookがベトナムでの反政府コンテンツの制限に同意、数か月間の抑圧に屈す

ベトナムの国営通信社によると、Facebookはベトナムで一部の反政府コンテンツをブロックし、ユーザーがアクセスできないようにすることに合意した。同社のベトナムでのサービスは数か月間妨害されていた。

ロイター通信は、Facebook内部の情報提供者の談として、ベトナム政府が今年初め、政府を批判する投稿など、違法とみなされるさまざまなコンテンツを制限することをFacebookに要請していたと報道。ベトナム政府はその支配下にある現地のインターネットプロバイダーを利用してFacebookのトラフィックを使用不能なレベルまで遅延させることで、このソーシャルネットワークを妨害していた。

当時、このサービスの遅延は海底ケーブルのメンテナンスによるものであると説明されていた。影響がFacebook(および付随するMessengerとInstagram)に限られていたため、多くの人はこの説明を信じなかった。

通常、Facebookはこれまで対話の窓口をいつも開けておく姿勢を取ってきた。ただし今回の状況は通常とは言い難かった。今回は何百万人ものユーザーがサービスにアクセスできず、その結果同社は広告の機会を失っていたのだ。

この遅延は2月中旬から4月上旬まで7週間にもわたり、最終的にFacebookは政府の要求を受け入れた。

ロイター通信の情報提供者によると、「より多くのコンテンツを制限することを確約したとたん、通信事業者はサーバーをオンラインに復帰させた」という。

Facebookでは次の声明を発表し、具体的な事実には触れないものの、ロイターの報告の概ねを認めた。

当社は、ベトナム政府から同国で違法とみなされるコンテンツへのアクセス制限を指示されてきた。我々は表現の自由は基本的な人権であると信じ、世界中でこの重要な権利を保護し、守るために真摯に取り組んでいる。しかし、日常生活の中で当社を利用しているベトナムの何百万人もの人々に今まで通り当社サービスにアクセスいただけるよう、今回の決定に至った。

Facebookが、サービスの制限データ譲渡の両方の指示を政府から受けることはこれが初めてではない。同社はこのような要請を精査し、異議申し立てをすることもあるが、現地法を遵守するのがFacebookのポリシーだ。それが政府の検閲慣行の受け入れを意味する場合(ほとんどの場合がそうだが)でもだ。

同社による言い訳はいつもの事ながら(今回も含め)、このような抑圧されている国の人々には、サービスがまったくないよりも、不完全であってもFacebookのコミュニケーションツールを提供するほうがよいというものだった。

[原文へ]

(翻訳:Dragonfly)