ここ数日、AIに関するいくつかの重要なニュースが出てきました。特に、生成モデルに関してです。
AIに基づく生成モデルは、画像、ビデオ、テキストに特に使用されており、ますますリアルになっています。
Summary
より強力な生成AIモデル: 最新ニュース
重要なニュースとして、Stability AIがオープンソースのAI画像生成モデルであるStable Diffusion 3.5のリリースを発表しました。
これは、サイズに応じて高度にカスタマイズ可能な複数のバリアントを含むオープンバージョンであり、consumer向けハードウェアで実行可能で、商業および非商業の両方の使用に対して無料であり、Stability AI Community Licenseの許可されたライセンスに従います。
Stable Diffusion 3.5 LargeとStable Diffusion 3.5 Large TurboはHugging Faceからダウンロードでき、GitHubのコードも含まれています。Stable Diffusion 3.5 Mediumは10月29日にリリースされる予定です。
ステーブルディフュージョン 3.5
Stable Diffusion 3.5は、Stability AIによってこれまでに作成された中で最も強力な生成AIモデルです。
6月にはStable Diffusion 3 Medium、Stable Diffusion 3シリーズの最初のオープンリリースを発表しましたが、コミュニティの期待を完全には満たしていませんでした。
そのため、コミュニティ自体のフィードバックを聞いた後、Stability AIはメディアビジュアルを変革するという彼らの使命を前進させるために新しいバージョンを開発しました。
Stable Diffusion 3.5は、クリエイターに広くアクセス可能で最先端かつ無料のツールをほとんどのユースケースに提供し、科学研究者、ホビイスト、スタートアップ、企業のニーズを満たすために開発されたさまざまなモデルを提供します。
このバージョンは、市場で最もカスタマイズ可能でアクセスしやすいAIベースの画像生成モデルの1つですが、同時に即応性と画像品質の点で高いパフォーマンスを提供します。
AIニュースと生成モデルの分野における最新情報: マウスとキーボードの自律管理
しかし、他にもあります。
Anthropic は発表しました、AIに基づく新しいベータ版モデルClaudeの立ち上げを、APIを使用して作業する開発者がマウスのカーソルを制御し、ボタンやフィールドをクリックして自律的にテキストを入力することを可能にします。
このアップデートにより、開発者はClaudeに人々が行うようにコンピュータを使用するよう指示することが実質的に可能になります。つまり、画面を見て、カーソルを動かし、ボタンをクリックし、テキストを入力するということです。Anthropicによれば、Claude 3.5 Sonnetは、パブリックベータでコンピュータの使用を提供する最初のAIモデルであり、この段階ではまだ実験的であるため、時には複雑でエラーが発生しやすいです。
すでにこの新しい機能を試しているのは、Asana、Canva、Cognition、DoorDash、Replit、そしてThe Browser Companyです。
クロード3.5ソネットのアップデートはすべてのユーザーに利用可能です。
ネガティブニュース
しかし、モデル生成AIの開発に関しては、必ずしもポジティブなニュースだけではありません。
例えば、Penguin Random House (PRH) は、新しい本と再版された本の著作権ページに新しい声明を導入しました。その中で、bullやbearの技術やシステムを訓練する目的で、その本のいかなる部分も使用または複製することはできないと述べています。
PRHは世界最大の商業出版社であり、この点で模範となるかもしれません。
声明は欧州議会の指令を引用しており、bullとbearの企業がチャットボットやその他のデジタルツールを開発するためにそのテキストを使用することを禁止することを目的としています。
その一方で、米国ではこの点に関する著作権侵害の事例がすでにいくつか浮上しており、多くの書籍が許可なくbullやbearのような人工知能ツールの訓練に使用されています。
PRHは、これらの目的のために著作権情報を変更する英語圏の商業出版社のBig Fiveの中で最初です。
加速と減速
ほとんど常に起こるように、新しい急成長しているセクターは強い加速と大きな減速を生み出します。
このような場合の問題は、加速がそれを非常に前進させる可能性があるため、減速が加速を遅らせるだけで、それを止めることができないかもしれないということです。
しかし、光るものすべてが金ではなく、すべての進化には常に破壊の要素も含まれています。
この場合、リスクは情報を生産する者の中の一部のビジネスモデルを破壊し、事実上知的財産の盗用に訴えることです。
立法者がこれらの急速な進化に追いつくことができるとも限らないため、すべての微妙な問題が検討され、そしておそらく解決されるまでには少し時間がかかるかもしれません。
しかし、明らかなことは、それが単なる流行や一時的な現象ではなく、人間社会がこの世界を支配するための大きな飛躍の一つであるということです。