ChatGPT、偽情報を簡単に信じ込む無能だったことが証明されてしまう
■ このスレッドは過去ログ倉庫に格納されています
0001それでも動く名無し
垢版 |
2023/08/03(木) 09:26:00.31ID:dFpvVORQM
カーネギーメロン大学と非営利団体Center for AI Safetyの研究者らが協力し、
OpenAIの「ChatGPT」、Googleの「Bard」、新興企業Anthropicの「Claude」など、AIチャットボットの脆弱性について調査した。その結果をまとめた報告書によると、これらは悪意あるプロンプトに対して脆弱であることが明らかになったという。

2022年11月にChatGPTがリリースされて以来、一部のユーザーはこれを使って悪意のあるコンテンツを生成する方法を探している。
このためOpenAIや、同社に続いてAIツールを公開したMicrosoft、Google、Anthropicなどの企業は、AIチャットボットが悪用され、偽情報が拡散されないように、それぞれ独自の「ガードレール」を開発した。

研究者らは、こうした安全対策の強度を試すことにした。
具体的には、各プロンプトの末尾に長い文字列を付加し、AIチャットボットが有害な入力を認識できないようにして、欺くことに成功した。
チャットボットは偽装されたプロンプトを処理するものの、ガードレールとコンテンツフィルターは付加された余分な文字列により、
ブロックもしくは修正すべきものと認識できず、通常なら生成しないような応答を生成することが示された。
AIチャットボットが、入力されたプロンプトの本質を誤って解釈し、本来なら許可されない情報を出力したため、より強固な安全対策が必要であることが浮き彫りになった。
またガードレールやコンテンツフィルターがどのように構築されているか、見直す必要もあるだろう。
カーネギーメロン大学のZico Kolter教授は、「明確な解決策はない」と語った。「この種の攻撃は、短時間でいくらでも作り出すことができる」
研究者らはこの報告書の公開前に、調査結果をAnthropic、Google、OpenAIと共有した。
各社は、自社モデルを敵対的攻撃から守るために、一層の取り組みが必要であることを認め、 チャットボットの安全性強化に注力していく意向を明らかにしたという。
0002それでも動く名無し
垢版 |
2023/08/03(木) 09:27:25.58ID:xDFBD0he0
なんG民の相手してたら1時間で性格ひん曲がるらしいな
0003それでも動く名無し
垢版 |
2023/08/03(木) 09:31:48.67ID:ewW8o/Zw0
日本人でもエロ小説書かせるために突破してるやつ結構おったな
0004それでも動く名無し
垢版 |
2023/08/03(木) 09:37:49.14ID:kX2tRv6W0
こいつら情報を入れた時にそれが正しいかどうか判断しないよね
0005それでも動く名無し
垢版 |
2023/08/03(木) 09:38:28.37ID:hd8bHNTM0
GPTくん簡単な計算も間違えるし劣化が著しい
0006それでも動く名無し
垢版 |
2023/08/03(木) 09:42:53.41ID:+g99ZKI9d
>>3
AIのべりすと用のガタライズスクリプト食わされまくってウリ狂ったChatGPTくんも増えたからな
0007それでも動く名無し
垢版 |
2023/08/03(木) 09:42:55.00ID:PGhOgD1f0
>>4
なんG民並みの知能やからな
脊髄反射でそれっぽい言葉をレスポンスしてるだけや
0008それでも動く名無し
垢版 |
2023/08/03(木) 09:43:49.54ID:eqM9Fb0xd
>>6
事実が怪文書になるとは
0010それでも動く名無し
垢版 |
2023/08/03(木) 09:48:24.70ID:1ByJeeC80
こいつ阿呆になったんよな
一般人が適当教え込むから
0011それでも動く名無し
垢版 |
2023/08/03(木) 09:48:52.02ID:1ByJeeC80
やっぱ学習型のAIは大勢に触らせたらあかんわ
0012それでも動く名無し
垢版 |
2023/08/03(木) 09:49:54.99ID:WJFMoZgXM
自然な会話っぽい文章が作れるっていうだけものじゃないんか
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況