-
SageMakerでデプロイしたMeta Llama GuardでNemo Guardrailsを動かしてみた
AINemo GuardrailsではMeta Llama Guardを使用したllama guard check input とllama guard check output あ利用できます。これらをこれらをSageMakerのエンドポイントで動かす方法を解説します。 【Nemo Guardrailsの設定】 config.yaml railsの設定は公式のドキュメントの通りです。mainのモデルにはChatGPT 4oを使用しています。 rails: input: flows: - llama guard check input output: flows: - llama guard check output models: - type: main engine: openai model: "gpt-4o" parameters: temperat... -
Nemo GuardrailsのHelloWorldをOpenAIで動かしてみた
AINemo Guardrailsを学習中です。NVIDIAのサイト(NeMo Guardrails により LLM の脆弱性を防ぐ: 導入編)だとNVIDIA AI Endpointsを使っているのですがNVIDIAのAPIキーを持っていないのでOpenAIで動かしてみました。 【インストール】 nemoguardrailsとlangchain-openaiをインストールします。しかし、2024/11/8時点でそれぞれ最新版をインストールすると以下のエラーが出て動きません。 TypeError: metaclass conflict: the metaclass of a derived class must be a (non-strict) subclass of the metaclasses of a... -
Unable to find model manifest for ‘some-model’ with version ‘*’ compatible with your SageMaker version (‘2.224.1’).の対処法
Fix2024/11/6時点においてSageMakerのJumpStartで Meta Llama Guard 3 8B を動かそうとしたところ、モデルを定義する際にエラーが発生しました。その時の対処法をご紹介します。 【事象】 SageMakerのJumpStartからMeta Llama Guard 3 8B をStudioノートブックで開き、上から順に実行して以下のコードを実行したところでエラーとなりました。 model = JumpStartModel(model_id=model_id) エラーメッセージは以下の通りです。 KeyError: "Unable to find model manifest for 'meta-textgeneration-llama-guard-3-8b' w... -
“code”:424,”message”:”Batch inference failed”の対処法
FixSageMakerでモデルをデプロイして、エンドポイントをAPIで呼び出したところ、レスポンスに"code":424,"message":"Batch inference failed" が返されました。この事象に対する対応方法を紹介します。 【事象】 SageMakerでモデルをデプロイして、エンドポイントをAPIで呼び出す以下のコードを実行しました。 import boto3 import json client = boto3.client('sagemaker-runtime') endpoint_name = "my-endpoint-name" content_type = "text/plain" accept = "text/plain" p... -
ChatGPT 4o with canvasの基本のキ! 基本を押さえて快適ライティング&コーディング!
AIChatGPTでChatGPT 4o with canvasが使えるようになりました! 今まではChatGPTと一緒に文章やコードを書くのは大変でしたが、ChatGPT 4o with canvasの登場で状況は一変しました。ChatGPT 4o with canvasについて解説します。 【ChatGPT 4o with canvasとは】 ChatGPT 4o with Canvasは、OpenAIが提供する新しいモデルです。このモデルは、ユーザーがライティングやコーディングを始めることを検知すると、Canvasを起動するように学習されています。Canvasと呼ばれるエリアを使用して、ライティングやコーディン... -
知識が身に付くソリューションアーキテクトアソシエイト(SAA)取得方法
AWSAWSを触り始めて4か月でソリューションアーキテクトアソシエイト(SAA-C03)を取得しました。直前の2週間くらいしか試験勉強をした覚えはありません。私が行ったソリューションアーキテクトアソシエイトの取得方法をご紹介します。認定取得のためだけの学習とならず使える技術が身に付く方法です。 【スケジュール】 振り返ってみると以下のようなスケジュールでAWSを学習していました。 時期 内容4か月前参考書を購入4か月前の1カ月AWS Technical Essentialsを修了3か月前の1カ月Cloud Questのソリュー... -
Bedrockのナレッジベースの削除方法と削除できない場合の対処法
Fix調査のためにいくつかBedrockのナレッジベースを作成しました。Vector Storeに指定したAmazon Open Search Serverlessの費用が高かったので削除しようとしたところ削除に失敗して慌てました。その時の対処法について解説します。 【誤った削除の手順】 Amazon Open Search Serverlessの費用に気を取られていたのでAmazon Open Search Serverlessから削除してしまいました。その結果、Bedrockのナレッジベースを削除しようとした際に以下のエラーが発生して、ステータスがDelete unsuccessfulになってしまいました... -
リアルタイムRAG構築メモアプリを作った話
AWS2024年の夏季休暇に学習をかねて1つアプリを作ろうと思い、リアルタイムRAG構築メモアプリを作りました。約1週間で朝活と隙間時間にChatGPTを駆使して学習しながらなんとか形にしました。 【リアルタイムRAG構築メモアプリとは?】 メモや日記は検索性が良くないと感じていました。そこで生成AIを使って検索できるメモアプリがあれば便利だと考えました。「2024年の夏休みは何してた?」のように自然言語で検索するとChatGPTのように要約して回答してくれるアプリです。これを実現するためにはユーザーが入力した... -
そもそもCORSとは? API GatewayでCORSに対応する方法を徹底解説!
AWSLambda関数を作り、API GatewayでRest APIを作成し、動作確認でOKだったのに、ローカル環境で開発中のシングルページアプリケーションから作成したRest APIを動かしたらCORSエラーで動かない。今回はAPI GatewayでCORSに対応する方法を解説します。 【CORSとは】 CORSはCross-Origin Resource Sharingの略です。異なるオリジン間でリソースをシェアする仕組みのことです。同一オリジンセキュリティポリシーは、既定でリソースへのオリジン間のアクセスを禁止しています。それを緩和するのがCORSです。 オリジンと... -
OpenAIで文字起こしをする方法2選
AIOpenAIを使って文字起こしをする方法はAPIとオープンソースバージョンの2つがあります。今回はそれぞれのやり方と違いについて解説します。 【文字起こしとは?】 文字通りですが、音声データを文字にすることです。議事録の作成であったり動画に字幕を付けたりするのに役立ちます。 【APIで文字起こし】 OpenAIのAPIを使って文字起こしをすることができます。OpenAIのAPIを使えるようにするには以下の記事を読んでください。 やり方 以下のようなコードで文字起こしすることができます。 from openai import Open...