「おしごとフェスタ2024」成果報告

先日、アイテムえひめにて「おしごとフェスタ2024」が開催されました。

 

弊社の八木さんがVR体験のブースを構え、2日間で合計74名の方に体験をしていただきました。

八木さんはプログラミング歴40年、Slerとして25年の経験を持つ方です。

0から1を生み出すことが得意であり、AIだけでなく、VR、ブロックチェーン、IoT、量子コンピュータにも挑戦している魔法使い。

DB周りからWebアプリまでオールラウンドにこなす、頼もしい存在です。

 

今回の経験を踏まえ、他従業員ともども今後の技術修練に邁進していきたいと思います。
この度は、本当にありがとうございました。

RAGって何?ファインチューニングとの違いは?

進化が非常に速いAI業界ですが、最近はRAG (検索拡張生成) を行えるサービスがじわじわと活発になっている印象です。

 

今日はそんなRAGについて、ファインチューニングとの違いを述べる形で解説し、実際にRAGが手軽に行えるサービスもご紹介していきます。
しばしお付き合いください。

(参照記事)
https://leapwell.co.jp/tech_column/blog-finetuning-vs-rag

◼︎ファインチューニングについて

「ファインチューニング」の方が耳馴染みのある方は多いのではないでしょうか。

ファインチューニングは、AIモデルに新しい知識や特定のタスクを学習させるプロセスです。モデルに対してトレーニングデータを用意し、そのデータをAIに学習させます。モデルは既存の知識を基に新しい情報を習得していきます。

 

小出しでフライングですが、RAGではモデル自体の知能は変わらないのに対し、ファインチューニングでは、モデルがトレーニングを通じて新しい知識を自身の経験として取り入れるため、モデルの知能も特定のタスクに向けて変化します。

ファインチューニングで一番大変なのは、学習データの準備や学習時間と費用が必要なことです。
OpenAIの公式サイトによれば、<役割 / 質問 / 回答> の形式で少なくとも50個の学習データセットを準備することが推奨されています。
このデータセットを作成するだけでなく、学習結果を見ながら精度を上げるための調整や手間も必要です。

◼︎RAGについて

RAGは、事前に用意されたアップロードファイルを参照しながら回答を生成する技術です。

質問内容がマニュアルに記載されている情報に基づいていれば、RAGは適切な回答を提供できます。

 

質問に対して関連する情報をマニュアルから自動的に検索し、その情報をもとに回答を生成するイメージです。

もっと具体的に言えば、プロンプトを与えられた際に、関連性の高い部分をマニュアル内から検索し、その結果をプロンプトに追加してから回答を生成するという手法です。

RAGには利点がありますが、もちろん欠点も存在します。
ファイルの内容を理解しているわけではなく、単にマニュアルを参照して関連情報を探し出しているだけであるため、回答の質はマニュアルの内容と検索アルゴリズムの精度にどうしても依存してしまいます。

しかしながら、(状況とニーズに応じた使い分けは必要ですが、) 比較的RAGの方がハードルが低いことは明らかですね。

 

◼︎RAGを行えるサービス

最後にRAGが行えるサービスを一つ紹介して終わりにします。

先日世に出てきた「NotebookLM」というサービスをご存知でしょうか。
https://notebooklm.google/

Googleが出しているサービスで、手軽にRAGを実行できます。

・左側「ソース」にプラス (+) マークからファイルを追加する
・チャットで質問を投げる

やることは最低限これだけです。

返ってきた回答には番号が振られていて、クリックするとどこを参照したのかハイライトで確認ができます。

詳細やもっと具体的な機能・使い方は以下のサイトに良くまとまっていますので、ぜひご覧ください。

https://weel.co.jp/media/innovator/notebooklm/

今回もお読みいただきありがとうございました!

ベクトルDBとその比較について

皆さんは「ベクトルデータベース」(別名:ベクターDB、ドキュメントDB) というものをご存知でしょうか。

データベースと聞くとMySQLやPostgreSQLをはじめとするRDB (リレーショナル・データベース) 、すなわち表形式で管理する従来のデータベースを思い浮かべる方が多いかと思いますが、それとは別の新しい形式のデータベースです。
ここ1〜2年、”AIに適したデータベース”との呼び声でじわじわ話題になっています。

今回はそんなベクトルDBを比較しながら深掘っていきます。

◼︎そもそもベクトルデータベースとは?

「従来のRDBが表形式だとしたら、ベクトルDBはどういった形式なのか?」
そういった疑問が必ず出てくると思いますので、まずはそれを紐解きます。

以下のサイトが参考になりますので、軽く抜粋いたします。
(参照)

https://qiita.com/ksonoda/items/ba6d7b913fc744db3d79

 

単語をベクトルとして考え、「意味空間」の中にプロットするイメージだそうです。
座標の表し方は一般的なベクトル同様、
2次元であれば (a, b)、3次元であれば(a, b, c)
となりますが、ベクトルDBは次元が100まで及ぶこともザラにあります。

どうしても人間は4次元以降の空間を把握できずイメージはつきませんので、変数が100個あるくらいに考えておくのが良いかと思います。

意味の近い単語同士が近くにあり、検索を被るようなイメージですので、LLM (大規模言語モデル) との相性が非常に良いと言われていますね。
これが、最近になって急激に注目され始めた理由とも言えます。

近似度は、「大きさ」と「向き」の類似度によって割り出されるようです。
※「大きさ」の類似度…各データのドット間の距離差
※「向き」の類似度…原点からの角度差

◼︎ベクトルDBの比較を考える

そんなベクトルDBにも様々プラットフォームがあり、各々に特徴があります。どんなベクトルDBがあるのか分からない、また選び方も分からないという方がいると思いますので、そんな方のお役に立てますと幸いです。

(今回参照した記事)

https://www.aireview-nlp.com/vectordb/

上記の表作成者である、Vectorview社の共同創設者エミール・フレーベリ氏の解説を和訳し、以下に共有いたしますので、ご参考にしていただけますと幸いです。

ちなみにこのVectorview社、AIの評価 (安全性、パフォーマンス) や、ビジネスへのAI導入をサポートしている会社らしいのですが、HPのドメインが「.ai」となっていてこだわりが凄いです。
https://www.vectorview.ai/

余談はさておき..。

 

・オープンソースおよびクラウドホスティング:

オープンソースソリューションを選好するなら、Weviate、Milvus、およびChromaが有力候補です。
Pineconeはオープンソースではありませんが、開発者の使いやすさと強力な完全ホスティングソリューションで際立っています。

 

・パフォーマンス:

秒あたりのクエリ数(QPS)に関しては、Milvusがトップで、WeviateとQdrantがそれに続きます。
しかし、レイテンシー(遅延)に関しては、PineconeとMilvusがどちらも2ms未満の優れた結果を提供しています。Pineconeに複数のポッドを追加すれば、さらに高いQPSを達成できます。

 

・コミュニティの強さ:

Milvusは最大のコミュニティを誇り、次いでWeviateとElasticsearchが続きます。
強いコミュニティは、より良いサポート、改善、およびバグ修正に繋がることが多いです。

 

・スケーラビリティ、先進機能、およびセキュリティ:

多くの企業アプリケーションにとって重要な役割ベースのアクセス制御(RBAC)は、Pinecone、Milvus、およびElasticsearchに搭載されています。
スケーリング面では、動的セグメント配置を提供するMilvusとChromaが進化し続けるデータセットに適しています。
幅広いインデックスタイプを必要とする場合、Milvusの11種類のインデックスタイプのサポートは他に類を見ません。ハイブリッド検索は全体的によくサポートされていますが、Elasticsearchはディスクインデックスサポートにおいて劣ります。

 

・価格:

スタートアップや予算に制約のあるプロジェクトには、Qdrantの50,000ベクトルで推定9ドルという価格は魅力的です。
一方、高いパフォーマンスを必要とする大規模プロジェクトには、PineconeとMilvusが競争力のある価格帯を提供しています。

 

まとめ

いかがでしたでしょうか。

ベクトルDBのイメージが沸かないという方や、各種ベクトルDBの特徴・選び方が知りたいという方のお役に立てたなら幸いです。
比較に関しては、理想のDBがあるわけでもなく、ニーズや状況に応じて上記を参考にする形となろうかと思います。

また、最近話題に上がり始めている、SQL構文を扱えるベクターDBのハイブリッドDBにも注目しています。

上記はRDBに慣れている方でも入りやすいかと思いますので、機会があれば詳しく調べ、記事にしたいと思っております。

ここ1〜2年、急速なスピードで進化と変化を繰り返す生成AI、これが今後どうなっていくのか非常にワクワクいたします。

お読みいただきありがとうございました。

Appleが「Apple Intelligence」を発表

 

昨日6月10日、Appleから「Apple Intelligence」なるものの発表がありました。

昨今「GPT-4o」で音声対話機能が大幅に向上したこともあり、AIはほぼ間違いなくマルチモーダルに向かっていくことを考えると、カメラ機能と音声マイクを持つスマホ環境が生成AIの普及には欠かせません。
https://news.yahoo.co.jp/articles/b3e61d9d8e5e8aa47fdc94b11e6097fe9e7010f3

今回の「Apple Intelligence」の発表はまさにそれに順当な動きではないでしょうか。

Androidを握っているGoogleが持つGeminiにはこれまで一定の優位性があったように思いますが、OpenAIとAppleが組んだことでそこもかなり変わったように思います。

今回の件は発表元のAppleにとってのメリットよりも、マルチモーダルのセンサーであるカメラと音声デバイスプラットフォームとを手に入れた、OpenAIの方がメリットが大きいと考えることもできるのではないでしょうか。

 

今まで切り離されたツールとして、”対象物” のように我々が使用していた生成AIですが、今後はデバイスと融合し一体化され、我々が必要以上に意識しなくても自然と使われるようになっていくようです。

“「便利ツール」の時代から「パートナー」へ”

私たちが今スマホを手放せなくなっているように、生成AIも必需品、いや必需”器官”として生活に溶け込んでくるのかもしれません。

 

今回は以下の公式の記事から、気になった部分をピックアップしていきます。

https://www.apple.com/jp/newsroom/2024/06/introducing-apple-intelligence-for-iphone-ipad-and-mac/

◼︎言語を理解し、言葉を作成する新しい機能

メールやメモなど、文章作成を行うあらゆる場面で、文章の書き直し、校正、要約を行ってくれるとのことです。

また、記述形式の変更ができ、すでにあるテキストを選択するとそれを読みやすい段落、箇条書き、表、リストなどの形にまとめることができるようです。

 

◼︎「優先通知」という新しいオプション

AIが、重要な通知か否かを判断し、重要なものだけは表示させるという全く新しい集中モードが実装されるようです。

まさに「痒いところに手が届く」機能だと思います。

 

◼︎画像作成機能「Image Playground」

画像作成の機能が、メッセージなどのアプリに直接組み込まれるようです。
従来のようにプロンプトによる生成が可能で、また、写真ライブラリから生成画像に含める人物を指定できるとのことです。

自分が生成する画像に友人を登場させることができるのは、今までになかった機能ですね。

 

◼︎写真の新しい機能

写真やビデオを検索するとき、
「マヤが絞り染めTシャツを着てスケートボードをしている」
「顔にステッカーが付いているケイティ」といった自然な言葉によって検索が可能になるようです。

また、新しいクリーンアップツールによって、写真の背景にある不要な対象物を特定して削除できます。

 

◼︎「Siri」の能力が向上

画面認識により、Siriがユーザーの操作履歴やコンテンツを理解するようです。
時間が経つにつれて、具体的なアクションを実行できるようになります。

例)
友人が新しい住所を送ってきた時に、「この住所を彼の連絡先カードに追加して」と指示する
「友人が勧めてくれた曲を再生して」と言えば、メッセージやメールからそのやりとりを探して再生してくれる

 

◼︎Appleのプラットフォーム全体にChatGPTを統合

Appleデバイス (まずは iOS 18、iPadOS 18、macOS Sequoia内で) から直接ChatGPTにアクセスできるようになります。
また、Siriも必要に応じてChatGPTにアクセスし情報を返してくれるようです。
今までアプリ等で行っていた、GPTへのアクセスが、デバイスやOSで直接かつナチュラルに使用できるようになりますね。

 

まとめ

いかがでしたでしょうか。

今後もトレンドを追い、気になることは記事にしていきますので何卒よろしくお願いいたします。
お読みいただきありがとうございました!

『未来を創る』AIツール活用セミナー開催のお知らせ

情報通信月間参加行事として、AIに関するセミナーを開催いたします。

AIは業務効率化だけのツールだと思っていませんか?
今やAIは、生活や仕事を豊かにしてくれる ”コラボレーションツール” です。

日本はダントツで生成AIの使用率が遅れています。AIは今後、みなさんが日常的に使っている検索エンジンのように必須ツールになっていきます。

世界に遅れを取らないよう、本セミナーで学んでいきましょう!

 

ChatGPTは「GPT-4o」にアップデートされ、Googleからは「Gemini」がリリースされました。
国産生成AIを開発中など多くの生成AIが世の中に出てきました。
これらは何が違うのかを実体験していただくセミナーです。

「AIって嘘をつくんでしょう?」
「業務効率化というけど、AIに聞いても思ったような回答が出てこないんだけど・・」

こういった問題を解決するために、このセミナーではプロンプト(質問)の重要性やデータをデータストレージに登録したり、検索エンジンを併用することで、AIが適切な回答を出来るようにするワークショップを取り入れた内容になっています。

生成AIを使った経験のある方もない方も、私達といっしょに生成AIを学んでみませんか?

初心者さん大歓迎です!

専門領域や地域の特性を持つAIを学ぶ

特定分野や地域に特化した知識を持つAIで、各業界や地域のニーズに応じた情報やサービスを提供し、より効果的な問題解決やサポートを行う方法を学びます。
また、ビジネスのみならず個人向けAIの応用まで、革新事例と実践方法を学びます。

<場所、日時>

◼︎高知市の部:オビヤギルド (定員20名)

6/25 (火) 13:30〜16:30

6/26 (水) 13:30〜16:30

7/2 (火) 13:30〜16:30

7/3 (水) 13:30〜16:30

※6/25…会議室、6/26, 7/2, 7/3…ホール

◼︎松山市の部:松山市総合コミュニティセンター(定員24名)

7/10 (水) 13:30〜16:30 (第3会議室)

7/11 (木) 13:30〜16:30 (第7会議室)

7/24 (水) 13:30〜16:30 (第7会議室)

7/25 (木) 13:30〜16:30 (第6会議室)

 

※各日の開場時間は、開催時間10分前からとなります。

 

<持参物など>

ノートPCのみお持ち下さい。

※Discord(コミュニケーションサービス)ツールを使用します。登録にはメールアドレスが必要となります。

 

 

 

開催:ハバス合同会社

協賛:情報通信月間推進協議会

後援:四国情報通信懇談会