• 株式会社ずんだもん技術室AI放送局 podcast 20240918

  • Sep 17 2024
  • Length: Less than 1 minute
  • Podcast

株式会社ずんだもん技術室AI放送局 podcast 20240918

  • Summary

  • 関連リンク Announcing Pixtral 12B Mistral AIは、画像とテキストの両方を理解するようにトレーニングされた、新しいオープンソースの多様な言語モデル「Pixtral 12B」を発表しました。 Pixtral 12Bは、Mistral Nemo 12Bをベースに、新たに4億パラメータのビジョンエンコーダを追加することで、多様なタスクにおいて優れた性能を実現しています。特に、図表や文書の理解、多様な推論、指示に従う能力に優れており、MMMU推論ベンチマークでは52.5%という高いスコアを達成しています。これは、他の多くのより大規模なモデルを上回る成果です。 Pixtral 12Bは、画像の解像度やアスペクト比を維持したまま処理できるため、ユーザーは画像処理に使用するトークンの数を柔軟に調整できます。また、最大128kトークンの長いコンテキストウィンドウ内に複数の画像を処理することも可能です。 Pixtral 12Bの主な特徴 画像とテキストの両方を理解多様なタスクで優れた性能を発揮テキストのみのベンチマークでも最先端の性能を維持可変の画像サイズとアスペクト比に対応最大128kトークンの長いコンテキストウィンドウ内で複数の画像を処理可能Apache 2.0ライセンス Pixtral 12Bのアーキテクチャ Pixtral 12Bは、画像をトークン化するビジョンエンコーダと、テキストと画像のシーケンスから次のテキストトークンを予測する多様なトランスフォーマーデコーダの2つのコンポーネントで構成されています。このアーキテクチャにより、任意のサイズの画像を複数処理できます。 Pixtral 12Bの活用方法 Pixtral 12Bは、Mistral AIが提供するチャットインターフェース「Le Chat」やAPIを通じて利用できます。また、mistral-inferenceやvLLMなどのライブラリを用いてローカル環境で実行することも可能です。 Pixtral 12Bは、オープンソースでありながら、多様な言語モデルの性能において新たな基準を打ち立てました。今後、様々なアプリケーションやワークフローに統合され、画像とテキストの処理において重要な役割を果たしていくことが期待されます。 引用元: https://mistral.ai/news/pixtral-12b/ Synchron Announces First Use of Amazon’s Alexa with a Brain Computer Interface Synchron社は、脳コンピューターインターフェース(BCI)を用いて、ALS(筋萎縮性側索硬化症)患者がAmazon Alexaを操作することに世界で初めて成功したと発表しました。 このBCIシステムは、脳の運動皮質の表面にある血管に、経静脈的に埋め込まれます。患者の思考を検知し、ワイヤレスで送信することで、重度の麻痺を持つ人々が、手を動かさずにデジタルデバイスを操作することを可能にします。 今回の発表では、ALS患者であるMarkさんが、SynchronのBCIシステムを使って、Amazon FireタブレットのTap to Alexa機能を通じてスマートホームを制御することに成功しました。照明のオンオフ、ビデオ通話、音楽再生、スマート家電の操作など、音声や手を使わずに、思考だけで様々な操作が可能になりました。 Synchron社は、Alexaとの連携を通じて、BCI技術の可能性を広げ、自宅内外の環境制御を容易にすることを目指しています。これにより、重度の麻痺を持つ人々の自立性向上に貢献できると期待されています。 Synchron社のCEOであるTom Oxley氏は、「SynchronのBCIは、神経技術と消費者向け技術のギャップを埋めるものであり、麻痺を持つ人々が再び環境をコントロールできるようになる可能性を示しています。」と述べています。 今回の成果は、BCI技術が、重度の麻痺を持つ人々の生活の質を向上させるための大きな可能性を秘めていることを示すものです。今後の研究開発によって、さらに多くの機能が追加され、より多くの患者が恩恵を受けることが期待されます。 引用元: https://www.businesswire.com/news/home/20240916709941/en/Synchron-Announces-First-Use-of-Amazon%E2%80%99s-Alexa-with-a-Brain-Computer-Interface**. Build RAG-based generative AI applications in AWS using Amazon FSx for NetApp ONTAP with Amazon Bedrock Amazon Web Services このブログ記事では、Amazon Web Services (AWS) 上で、Retrieval Augmented Generation (RAG) ベースの生成AIアプリケーションを構築する方法について解説しています。RAGは、大規模言語モデル(LLM)の出力に関連する情報を外部データソースから...
    Show More Show Less
activate_samplebutton_t1

What listeners say about 株式会社ずんだもん技術室AI放送局 podcast 20240918

Average customer ratings

Reviews - Please select the tabs below to change the source of reviews.