SSブログ
電脳サイエンス考 ブログトップ

20230313:人間だって嘘をつくし、間違える(生成AI基-大規模言語モデル) [電脳サイエンス考]

 MS社が検索エンジンとして "Bing" に導入した "ChatGPT" が世界中で話題となっていて、それは日本でも例外では無い。
 問い合わせに対して "正しい" 返答する事が多いが、"間違い" もある。 命題を与えると本当にそれらしい文章を書き下して、人間が書いたモノかAIによるものか区別が付かない程に完成度が高い場合もある様だ。

 が、大方の新聞は "間違い" を見つけて
   -だから信用できない
   -実用化にはまだまだ・・・

ってな論調が多い。
 しかし、人間だって間違いをしでかす。 完璧な人間なぞどれ程存在するのか疑わしい。 なのに、AIのそれを鬼の首を取ったかの様に否定材料にするのはどうか・・・な? 間違いを "間違いとした学習" を積み重ねて行けば間違う確率を↓する事は可能だろうに。

ところで:
 生成AIをベースとした大規模言語モデルは過去の "ファクト" :
   A は B ( A ≡ B )

とする超膨大な事例を学習して知識として蓄えている・・・とすれば、"嘘" をどう見分けるのか、その為には何が必要なのか、老生にはとても興味がある。 だって見分けられなければ嘘が嘘を呼ぶ・・・つまりは "嘘の再生産" が拡大していってしまう。
 例えば、今は大昔に "ルイセンコ学説" ってのがあって、スターリン時代に政治の庇護を受けて罷り通った事があったが、結局は "正当" 科学が勝利した "事件" があった。 これなんぞをこのAIに検証させたらどうなるのか・・・試して観たいものだ。
 また、例えば
  ①ゴッホが描いた絵と、彼のタッチを学んだAIが描いた絵を見比べて、

 或いは
  ②ヘミングウェイが書き下した小説と、彼の文章スタイルを学んだAIが創作した
   作品を見比べて、

このAIがどちらがホンモノって判断するには何が必要なのか、何を前提とすれば良いのか・・・等々、興味が尽きない。

そう言えば:
 学術論文を書き下すAIも出現し、Nature誌(英)では明記さえすればAI利用論文だって査読にパスすれば掲載される扱いの様だ(但し共同執筆者扱いは不可)。 これに対してScience誌(米)ではAI関与論文自体を拒否しているとの事だ。

が・・・:
 今後は実験結果の解釈を含む様々な過程でAIが関与、或いは作成した学術論文が大量生産されだしたらどうなるのだろうか。
 恐ろしい様な、AIとの共生がタメされている様な・・・

ついでに・・・:
 この種のAIが更に革新していけば(、或いは既に)古いノートを使って毎年同じ講義を繰り返す教授は淘汰されていく・・・のは大歓迎だ(老生の学生時代は確かにこう言う高齢教授がいた)。

そして・・・:
 小器用な学生さんなら卒論命題に対して生成AIを駆使して小論文を書かせ、"適当に手直しして" 見事に最高点をとって卒業・・・何て事が絵空事ではなくなるのでは・・・先生等はそれを見抜くAIを欲しがるに違い無い。
 そう言うAIも、AI自身が開発するのだろうか・・・
 だって今や既に部分的ではあるけど所謂 "シンギュラリティー" を越えたAIが登場舞台の袖で待っているかの様な時代・・・そんな感じさえするのです。

共通テーマ:日記・雑感

20210604:”GPT-3”(言語AI)を ”東ロボ君” に搭載したら・・・ [電脳サイエンス考]

 我が国の AI-プロジェクトの一つ:"東ロボ君"(2021年度東大入試合格 AI-ロボット)開発は "失敗" に終わっているが、どっこい、米国の "オープンAI"(非営利組織=NPO)が開発した言語AI:"GPT-3"(*1) を発展的に日本語版化して搭載したら、東大入試突破可能となるに違い無い。

 誰が観ても本物と間違えてしまう絵画や音楽の作画/作曲に特化した AI ・・・これはとっくに実現されている。 造形分野だって3Dプリンターと組み合わせれば名人作品を再現出来る AI だって実現されている。 チェス・囲碁・将棋等の頭脳対戦競技に至っては既に AI は人間様を凌駕している程だ。

そしてついに:
 言語を解する AI の実現は難しいとされてきたが、最近になってとてつもない進展を見せてきた。
 MS社等が資金提供してきた NPOオープンAI が開発したGPT-3は、人間の脳神経回路を可能な限り模倣して数千億の "単語" を、更に人間が一生かかっても読み切れない程の "文書" を読み取り、その "成り立ち" を記憶していて、人間の問いに対しての解答や、キーワードを与えれば最適な文書作成も可能との事だ。
 実際、プロのブロガー等に混じって投稿したブログのランキングで見事に首位獲得も遂げている。 その中身は生身の人間と変わるところを見つけるのは難しい(英語文だから自分にとっては尚更だ)

 このGPT-3開発には、卓越した開発アイデアと、東ロボ君プロジェクトとは桁違いの巨額資金が投入されて、自由自在に文書DB及びスパコン資源を使いまくった結果、驚異的な理解力を有する言語 AI の開発に至ったとされる。
 この分野の学識者をして、
  「すでに人間と同等レベルの言語能力を獲得している

と言わしめている程だ。 ここで言う "人間" が如何程の知識人に相当するのか迄は不明だが、知識の数だけを言えば人類の誰よりも進んでいる筈だ。

 そのアルゴリズムは公開されいて、活用するアプリが多数出始めているとか。
 そこで、その原理を日本語版へと展開して東ロボ君へ搭載したら、見事に復活、そして東大合格・・・って事になるに違い無い。

いやはや・・・:
 AI が人智を超えるシンギュラー・ポイントは "2045年" よりも早いのかも。 なぜなら人間の智の進歩は既に無いに等しいのに言語-AIは "いくらでも" 進歩出来るから(?)だ。
 そんな AI に
   ”人間は愚かな存在”

だって気がつかれでもしたら大変だ。
 まてよ・・・そんなSFがあったじゃないか・・・何だっけ? 最近、物忘れが酷くなって m(_ _)m
-----
(*1):"GPT" とは "Generative Pre-trained Transformer" で、"3" は "3代目" 。

共通テーマ:日記・雑感

20210525:分子シミュレーション@富岳(コロナ/細胞膜) [電脳サイエンス考]

 今時点で世界一の計算速度を誇るスパコン "富岳" を駆使して理研+立教大チームが
   "Covid-19既往変異種と人細胞膜との相互作用"

分子シミュレーション解析し、いわゆる "英国型" ウイルスの結合力が "武漢型" よりも増大している事を見い出し、感染力の強さを "裏付けた" としている。
 だが、併せて "南ア型" とか "ブラジル型" についても解析しているが、あまり明確な結果は得られなかった様で、今後は "実験による分析" が必要・・・との結果だった。

 オッと・・・ちょっと待って欲しい。
 それでは分子シミュレーションの本来意義は活かせていない。 実験を予測する精緻モデルの構築に向けての取り組みこそが神髄であって、"実験結果待ち" なら現行モデルがそれに達していない事を意味している・・・と考えるのがシミュレーションの道筋の筈だ。

 更に言えば、今注目されている "インド型" や今後出現するであろうCovid-19変異種、及びその感染力の予測シミュレーションこそが求められていると解するべきだ。
 それでこそ計算力を誇る富岳活用の意味がある。 実験事実の説明だけではシミュレーション屋の "自己満足" に終わってしまう。 確度の高い予測してこそ、シミュレーションの真価が認識されるのだ(*1)
 期待したい(ホントに)。
-----
(*1)20161205:"国内最速スパコン稼働へ” の記事を読んで・・・

共通テーマ:日記・雑感

20210428:時代は変わる(インテル社がファンドリー) [電脳サイエンス考]

 PC向け汎用CPU(中央演算処理ユニット)で圧倒的な市場占有率を誇り、時代の寵児だったインテル社@USAが、半導体 "受託製造" 事業( "ファンドリー" )へ乗り出すと知って "時代は変わった" ・・・ と想わずにいられない(*1)

 PCと言えば "インテル入ってる" ・・・ 1990年代以降の "常識" だったが、今や IT-企業自身が自社専用のCPU/GPU(画像処理ユニット)を設計し、その "システム・オン・チップ" をファンドリーへ製造させて自社製品へ搭載・・・アップル社等GAFAの戦略だそうで、"インテル離れ" が始まっていると言う。 CPU自体の微細加工も今では台湾のファンドリーが最先端で、インテル社は後塵を拝しているとの事だ。

 "設計" と "製造" の完全分離・・・正直、自分の様なロートルには余りにも変わり過ぎた半導体の世界がこれからどうなるのか解らない。 半導体の世界だけでは無く、自動運転自動車だって設計・センサー・製造・組み立て・販売業が分離し始めている例もちらほらとか。
 そんな時代なっているんですねぇ・・・考えても見ませんでした。
 つくづくそう感じています(クシュン)。
-----
(*1):B.ディランがこの事を予言していた?・・・なんて事は無い*2。 彼のゴールドディスク:"時代は変わる" を謳いあげたのは57年前(1964年)の事だったから、いくら何でも・・・

共通テーマ:日記・雑感

20171130:本当なら凄い! ”光” 量子コンピューター [電脳サイエンス考]

 NTTが国立情報学研究所や国の研究開発事業で培ってきた "光を媒体とした量子コンピューター" の開発に成功したと発表している(2017年11月20日)。
 米欧中でも国家プロジェクトが取り組まれている中、日本で "光" 量子コンピューターが開発された快挙を素直に喜ぶ。

 と言うのも、今回の開発機は、実用上最も重要なユーティリティにおいて、”常温で稼働” でき、しかも ”極わずかな消費電力” で済むからです(現役時代、僅か10年間程でしたが、既往のスーパーコンピュータの冷却を含む消費電力費の高さには悩まされた経験を持っていました)。

 ネット上で公開され、無償利用出来るとの事で、"自信" の程が垣間見えます。
 と言うのも、国からの委託事業では何よりも先ずは "成果" が問われるので(←何せ税金で賄われているので)、プレスリリースとか学会・展示会等各種イベントや報告書での "成功しましたよ発表" が必須であり、今回はそれに止まらずに "無償利用" に踏み込んでいるからです(技術が本物でなければこうはならない)。

 今回開発されたタイプは、いわゆる理論に基づいたシミュレーションの適用というよりも、"超多数の組み合わせの中から最適解を求める事に特化" しているとの事で、自分の関心あるテーマとしては、豊富なデーターベース(即ち、ファクト・データー)を駆使して目的機能を持つ素材構成候補を素早く見つけ出して、新たな原理の発見・理解が飛躍的に進む事です("マテリアル・インフォマティクス")。

 大いに期待しています。

ついでに:
 コンピュータ・シミュレーションについては自分は以下の様に捉えております。
 お時間あればご訪問の程を:
   "20161205:”国内最速スパコン稼働へ” の記事を読んで・・・"


共通テーマ:日記・雑感

20170926:量子コンピュータ [電脳サイエンス考]

 量子コンピュータが実戦で活躍する時代になってきたようです。

 自分は、現役の頃は業務の傍らで、また趣味でコンピュータとの付き合いは長いのですが、既往のコンピュータとは全く異なる原理で演算する量子コンピュータが実用化されるとはっ!

 これ迄のコンピュータの主体はいわゆるノイマン型数値処理をベースとしているが、量子コンピュータは素粒子、特に光子や電子の量子性(:"同時" に複数の状態を取り得る)を作動原理としていて、日本人学者の提案が基礎になっているらしい事は素直に嬉しいものの、正直、具体的にどういうアルゴリズムなのか、自分は理解出来ていない(新聞・雑誌等の説明図は余りに杜撰で、とても解説図とは言えない。つまり、記者も理解出来ていないのだと想います)。

 量子コンピューティングは、その原理からして超々大量データーの超高速同時処理が可能で、GPSデーターを利用した自動車渋滞解消(国内ではデンソーがトライ、海外ではVW社が北京で実験・検証済み)とか、既存化学品データーベースを駆使して新たな機能性材料の設計(タイヤ合成ゴムを意識した新材料開発に向けてはJSR社が計画)とかが始まろうとしている様です(日経紙:2017年9月15日付け朝刊第一面トップ記事)。

 ただ、どんなコンピュータを利用するとしても、その結果の質は "計算モデルの質" に極めて強く依存するので、海外製のソフトウェアをそのまま使うだけで世界に先駆けて新システムや新素材を設計・開発する事は難しい。
 現象の本質を深く理解してこそ、質の高い計算モデルを建てる事が出来る筈なので、使用者の能力が問われる事はこれ迄のコンピューター利用と何ら変わらないと想います (*)。
  (*):こんな "タメ口" をブログしています(実はブログ・デビュー記事です):
      ”20161205:"国内最速スパコン稼働へ" の記事を読んで・・・”

 我が国コンピュータ利用技術者の奮戦を期待しております。


共通テーマ:日記・雑感

20170622:“HITAC5020” 時代から今を観て・・・ [電脳サイエンス考]

 日立製作所が大型汎用コンピューター、いわゆるメイン・フレームのハードウェア開発を取りやめ、IBM社製マシンに自身のOSを搭載して事業継続を計るそうだ(出所:日経紙2017年5月24日)。

 メイン・フレームは超大量のデーター処理が出来る "最も信頼できるコンピューター" として、官公庁や大手企業の基幹システムに採用されており、国内では富士通が凡そ1/3、次いでIBM社が1/4、NECが1/5を占め、今や日立は後塵を拝して1/6強に留まっている様だ。

 コンピューターが高機能化の一方、小型化され、ネットで繋がり、クラウド運用が普及した結果、メイン・フレームの市場規模が国内外で縮小している事への対応との事でした。

 冒頭の報道を知って想い出したのですが、自分が始めてコンピューターを使い始めたのが名機と言われた "HITAC5020" ( ”ハイタック・ゴー・マル・ニイ・マル” )で、日立が科学技術計算等を念頭に開発・製作し、東大(@文京区本郷)の大型計算機センターに1966年前後に採用された初代機で、国内では京大、NTT(当時は電電公社)に次いでの導入だった(IBM社製にするか、国産機にするか、激しい競争があったとの事は後で知りました)。

 このセンターは全国大学共同利用施設となっていて、国公私立の区別なく理工系大学生等はそこで使用言語(フォートラン)を習い、自らプログラミングして技術計算をしていた。

 当時は一枚のカードに一行分の命令文を打ち込む方式で、そのパンチング・マシンも空くのを待っての作業だった。
 規模の大きい計算では千枚を軽く超えるパンチカードを専用の段ボール箱に納めてセンターへ預け、数日後に訪れてカードと共に計算結果を打ち出したB4版前後の紙面の束を受け取る。

 プログラムミス( "バグ" と言ってました)があると、その旨を伝える数行のコメントが打ち出された紙一枚!で終わり。
 これを数回繰り返してプログラムを完成させ、ケース・スタディを積み重ねる。
 "先端の取り組み" をしている割には、その作業はバッチ式で、効率は低く、今の様に居ながらにしてモニターを眺めてオンタイムで作業するスタイルは大分後になってからです。

 その日立がメイン・フレーム自体の開発から撤退すると言う。
 今や科学技術計算はスパコンを手軽に利用出来る時代だし、技術計算プログラムも数多く開発・公開され、共同利用される様になり、シミュレーション環境は格段に整備されている(*)。
 (*)ご参考:
   “20161205:”国内最速スパコン稼働へ” の記事を読んで・・・“

 ハードウェアとソフトウェアに恵まれた環境下では、シミュレーションのベースとなる "計算モデル" の良し悪しが結果の質を決める。

 と言うのも、経験から申し上げますが、全く同じソフトウェアを使っても計算モデルの立て方で結果は大きく異なるのが普通だからです(:計算モデルを組み立てる研究者に何が必要なのか、機会を改めてブログ致します。経験論に過ぎませんが・・・)。

 大量のデーターベースを背景に、機能性材料の計算設計の可能性も高まり、素材メーカーの取り組みも本気モードらしい。

 競争相手は米国に限らない。
 今では中国や韓国も手ごわい実力を持ってきており、日本勢の成果を期待するばかりだ。
 決して負けてはならない! 若手研究者諸君!!
 "モノ造り日本" で居続けられるかどうかは、貴方達次第だ。

追記:
 中国も韓国も “オープン・イノベーション” が進み、米国や欧州大学等の研究開発機関との連携でコンピューター利用技術の完成度を高める事に余念がないと言われている。

 何でも “自前主義” がお家芸だったわが国の製造業も国際協業へ進まざるを得ない程、技術革新の速度は速い。
 経営陣の誤りのない判断を祈りたい。
 東芝の様な大企業でさえ経営判断の誤りは企業自体の存続を揺るがしている。
 背景には3.11以降の原発事業の位置づけに関して、GE(ゼネラル・エレクトリック@米)とシーメンス@独は縮小・撤退の方向へ、東芝は中核事業に固持した事が指摘されている(:出所:日経紙2017年5月5日付)。
 今では東芝と海外勢との差異は絶望的な程にも広がってしまっている。
   ご参考:”20170330:原発の行方”

共通テーマ:日記・雑感

20170502:3Dプリンターで再生医療 [電脳サイエンス考]

 “物づくり” を革命するとも言われている “3Dプリンター” の再生医療分野での活用が始まろうとしているそうです。

 3Dプリンターとは、3次元(縦・横・高さ)の設計図を基に、コンピューター制御の下で樹脂や金属を少量ずつ積み重ねながら立体構造物を成形加工していく装置の事。

 直ぐにも思い付くのは立体地図とか立体模型等ですが、既に様々な部品やフィギュア等の精密かつ少量の試作や生産、海外では複雑形状の家具等の生産に活用され始めている事は知っていました。

 ところがこれが医療分野へ活躍の場を広げていると言うのです。
 皮膚の細胞から人体組織を作製した横隔膜治療(福岡大学等)、皮膚の立体構造を精密に再現した潰瘍治療(東京大学等)、骨髄細胞から組織を作製した膀胱治療(信州大学等)等が研究されていて、その成果が期待されている様です(出所:日経紙:2017年4月17日付け ”3Dプリンター 再生医療に活用”)。

 自分は理工系の人間なので、物づくりの観点からしか3Dプリンターを捉えていませんでしたが、この様な展開があるとは思ってもみませんでした。

 将来、タンパク質や細胞自体から神経とか、血管、更には臓器の再生が可能となる時代が来るかも

 これ等の難病を患っている若手の方々への治療の切り札になるなんて、夢でなくなる・・・そうなればいいなぁ・・・


共通テーマ:日記・雑感

20161205:”国内最速スパコン稼働へ” の記事を読んで・・・ [電脳サイエンス考]

 日経紙(2016年12月1日付け)によれば、富士通が開発・制作したスーパコンピューター ”オークフォレスト・パックス” の稼働が2017年4月から本格化するらしい。

 演算速度は2京5千兆回/秒で、”京”(理化学研究所設置)の2倍相当。
 使用者は東京大学+筑波大学で、東大柏キャンパス(柏市)内に設置し、大学・企業の研究開発に活用されると言う。 

 制作費+5.5年リース料は凡そ72億円(≒13.1億円/年≒1.1億円/月≒360万円/日)で ”京” の1/10とか。
 商業生産されている演算処理部品を活用して効率的な演算回路を設計・開発した成果らしい。

 演算速度は速いに超した事はないが、問題はそれを利用する中身だ。
 演算はプログラムによって実行され、プログラムは人間が書き下す。
 演算速度を速くするプログラム上の工夫はもちろん重要だが、最も重要なのは何を演算するのか、その対象と演算論理であり、その論理の土台となるモデルそのものだ。

 モデルの改良・完成度を高めるに当たって演算速度の向上は天気予報の精度や自然現象のシミュレーション等の分野では効果的であろう。
 が、新たな機能の発見やそれに基づく素材・薬物・医療設計等、経験値を最大限活用する AI との連携技術に飛躍が求められ、そこには独創力豊かな人知が求められる、と考える。

 海外産の商用ソフトウェアをそのまま導入・使用して、新たな素材や薬物設計を意図しても、自然科学への理解が深く無ければ無駄な計算を繰り返しているだけ・・・の様な風景を数多く観て来た経験から、こう思わずにいられない。

 独創力豊かな研究者が、予算に縛られる事無く自由に使い、画期的な成果が生まれる事を期待したいが、公用施設利用の際には ”既定概念豊かな” 審査陣が立ちはだかっているのが普通なので、これも課題だ。

共通テーマ:日記・雑感
電脳サイエンス考 ブログトップ