AI活用用語集

海辺康志

26.5.16

用語集

AI活用

概要

AI活用ロードマップに対応した用語集です。

AI活用イントロダクション

AI活用ロードマップ

ダウンロード

PDF版

内容

AIの基礎理解

用語	説明
Anthropic	Claudeシリーズを開発するAI企業です。安全性重視の設計と長文処理・推論の強さで知られます。
API	Application Programming Interfaceの略で、ソフトウェア同士が通信するための窓口です。AIサービスを利用する際、APIを通じてモデルに指示を送り、結果を受け取ります。
API連携	AIモデルの機能をAPI経由で呼び出し、自作アプリや業務フローに組み込む実装方法です。
Attention	Transformerで使われる注意機構です。入力中の各要素が他の要素とどの程度関係するかを計算し、文脈理解を高めます。
ChatGPT	OpenAIが提供する対話型生成AIサービスです。文章生成、要約、壁打ち、調査補助など幅広く使われます。
Claude	Anthropicが開発した大規模言語モデルです。長文の理解や論理的推論に強みを持ちます。
DeepSeek	中国発の生成AIモデル／サービスです。コード生成、数学、論理推論に強みがあります。
Gemini	Googleが開発したマルチモーダル生成AIモデルです。テキスト・画像・音声などを統合的に処理できます。
GLM	智谱AIが展開する大規模言語モデルシリーズです。中国語処理や多言語応用で用いられます。
Google	Geminiシリーズを展開する企業です。検索・クラウド・研究基盤と連携したAI開発に強みがあります。
GPT	Generative Pre-trained Transformerの略で、OpenAIが開発した大規模言語モデルのシリーズです。テキスト生成、要約、翻訳など幅広い用途に利用されます。
GPT-4o	OpenAIが提供するマルチモーダルモデルです。テキスト・画像・音声を統合的に扱えます。
Kimi	Moonshot AIが提供する対話型AIです。長文読解や大量PDFの処理に強みがあります。
OpenAI	ChatGPTやGPTシリーズを提供するAI企業です。生成AIの実用化を大きく前進させました。
Perplexity	言語モデルの予測精度を評価する指標です。値が低いほどモデルがテキストを予測しやすいことを示します。
Qwen	Alibabaが公開する大規模言語モデルシリーズです。多言語・マルチモーダル対応モデルも提供されています。
RNN	Recurrent Neural Networkの略で、時系列データを順番に処理する再帰型ニューラルネットワークです。Transformerが登場する以前に自然言語処理の主流でしたが、長文処理が苦手でした。
Transformer	入力データの全体を一度に処理し、要素間の関係性を学習するニューラルネットワークの構造です。現在の生成AIの多くがこの仕組みを基盤としています。
オープンソースモデル	ソースコードやモデルの重みデータが公開されており、誰でも自由に利用・改変できるAIモデルです。ローカル実行やカスタマイズに適しています。
クリエイティブコモンズ	著作物の利用条件を明示するためのライセンス体系です。AI生成物の利用可否や条件を確認する際に参照されます。
ツール利用	AIを単体で使うだけでなく、外部ツールやサービスと連携して実務タスクを処理する活用方法です。
ディープフェイク	AIを使って人物の顔や声を入れ替え、本物そっくりの偽の映像や音声を作り出す技術、またはその生成物です。悪用リスクと活用可能性の両面があります。
トークン	AIモデルがテキストを処理する際の最小単位です。日本語では1文字が1トークンになることが多く、APIの課金やコンテキストウィンドウの計算に関わります。
ニューラルネットワーク	人間の脳の神経回路を模した機械学習モデルです。入力層・隠れ層・出力層で構成され、層を深く重ねることで複雑なパターンを学習できます。
ハルシネーション	AIが事実とは異なる情報を、もっともらしく出力する現象です。生成AI特有の問題で、ファクトチェックによる確認が重要です。
プロンプト	AIに指示や入力を与えるテキストのことです。プロンプトの書き方次第で出力の品質や内容が大きく変わります。
マルチモーダル	テキスト・画像・音声・動画など複数の形式のデータを組み合わせて処理できるAIの特性です。Geminiなど現代の主要モデルの多くがこの能力を持ちます。
モデルカスタマイズ	既存モデルに追加学習や設定調整を行い、用途やドメインに合わせて振る舞いを最適化することです。
機械学習	データからパターンを学習し、予測や分類を行うAIの手法です。教師あり学習、教師なし学習、強化学習などに分かれます。
次単語予測	生成AIが文脈を踏まえて次に来る単語の確率を予測しながら文章を生成する仕組みです。
深層学習	ニューラルネットワークを多層にして学習させる機械学習の手法です。画像認識や自然言語処理などで高い精度を発揮します。
生成AI	テキスト、画像、音声などの新しいコンテンツを生成するAIの総称です。プロンプトと呼ばれる指示に基づいて出力を作り出します。
蒸留	大きなモデル（教師モデル）の知識を小さなモデル（生徒モデル）に転移させる手法です。DeepSeekなどが少ないコストで高性能を実現した技術的背景の一つです。

データ・知識設計

用語	説明
Chroma	オープンソースのベクトルデータベースです。RAG構築で埋め込みベクトルの保存・検索に使われます。
CSV	Comma-Separated Valuesの略で、カンマで区切られた表形式データのファイル形式です。データの入出力や加工に広く使われます。
Hugging Face Datasets	機械学習用の公開データセットを検索・ダウンロードできるプラットフォームです。多様なデータ形式に対応しています。
JSON	JavaScript Object Notationの略で、データを構造化して記述するフォーマットです。APIの入出力や設定ファイルで広く使われます。
Kaggle	データサイエンスのコンペティションやデータセットを提供するプラットフォームです。学習用データの入手にも活用されます。
Label Studio	画像・テキスト・音声など多様なデータのアノテーション作業を支援するツールです。AIの学習データ作成に使われます。
Markdown	見出しやリストなどの書式をテキストで記述する軽量マークアップ言語です。ドキュメントやナレッジベースの記述に適しています。
Pinecone	マネージド型のベクトルデータベースサービスです。大規模なセマンティック検索に適し、RAGのバックエンドとして利用されます。
アノテーション	機械学習の学習データに対してラベルや正解情報を付与する作業です。「この画像は猫」「この文章はポジティブ」のように人手で情報を付け加えます。
コンテキストウィンドウ	AIモデルが一度に処理できるテキストの最大長です。この制限を考慮して、プロンプトや参照データの量を設計する必要があります。
セマンティック検索	キーワードの一致だけでなく、意味的な類似性に基づいて検索結果を返す手法です。ベクトル検索と組み合わせて使われます。
チャンク分割	長いテキストを検索や処理に適した小さな単位に分割することです。RAGの前処理として重要なステップです。
ベクトル化	テキストや画像を数値のベクトルに変換することです。類似度計算や検索の基盤となります。
ベクトル検索	データをベクトルに変換し、意味的な類似性に基づいて検索する手法です。キーワード検索の限界を補うことができます。
埋め込み（Embedding）	テキストや画像を意味を保ったまま数値ベクトルに変換することです。意味が近い単語・文章は近いベクトルになり、セマンティック検索やRAGの基盤技術です。

エージェント・ツール呼び出し

用語	説明
Anthropic API	Anthropicが提供するClaude系モデルのAPIです。長文処理や推論を組み込んだアプリケーション開発に使われます。
AutoGen	Microsoftが開発したマルチエージェントフレームワークです。複数のAIエージェントが会話しながら協調してタスクを解決する仕組みを構築できます。
Claude	Anthropicが開発した大規模言語モデルです。長文の理解や論理的推論に強みを持ちます。
CoT	Chain of Thoughtの略で、AIに段階的に思考させる手法です。複雑な問題をステップごとに分解して回答精度を向上させます。
Coze	ByteDance系のノーコードAIエージェント構築プラットフォームです。チャットボットやワークフローを視覚的に構築できます。
CrewAI	役割を持ったエージェントにタスクを分担させるマルチエージェントフレームワークです。チームのように複数エージェントが協調して作業します。
Dify	ノーコード・ローコードでAIワークフローやチャットボットを構築できるプラットフォームです。RAGやエージェント機能を視覚的に組み合わせられます。
Function Calling	LLMが外部の関数やAPIを呼び出す仕組みです。AIの回答に基づいて適切な関数と引数を自動的に選択します。
Gemini	Googleが開発したマルチモーダル生成AIモデルです。テキスト・画像・音声などを統合的に処理できます。
GPT-4o	OpenAIが提供するマルチモーダルモデルです。テキスト・画像・音声を統合的に扱えます。
Haystack	RAGや検索拡張生成アプリケーションの構築を支援するフレームワークです。検索・生成パイプラインを組み立てられます。
LangChain	LLMを使ったアプリケーション構築を支援するPythonフレームワークです。RAG・エージェント・ツール連携などの実装を効率化する豊富なモジュールを提供します。
LlamaIndex	RAG構築を支援するフレームワークです。データの取り込み、インデックス構築、検索・生成を統合的に管理できます。
Make	ノーコードで外部サービス連携や自動化フローを構築できるプラットフォームです。AIサービスとの接続にも活用されます。
MCP	Model Context Protocolの略で、AIモデルと外部ツールの連携を標準化するプロトコルです。ツールの定義や呼び出しを統一的に管理できます。
n8n	ノーコードでワークフローを自動化するツールです。AIと外部サービスを繋いだ自動化フローを視覚的に構築できます。
OpenAI API	OpenAIのGPT系モデルをAPI経由で利用できるサービスです。チャット、構造化出力、コード補助などに使われます。
ReAct	推論と行動を交互に繰り返すエージェントの手法です。思考→行動→観察のサイクルで複雑なタスクを段階的に解決します。
Tool Use	LLMが外部ツールやAPIを利用する機能の総称です。Function Callingと同義で使われることもあります。
オーケストレーター	複数のエージェントを統括・調整する役割です。タスクの振り分けや結果の統合を担当します。
サブエージェント	オーケストレーターの指示に従って特定のタスクを実行する個別のエージェントです。
タスク完了率	エージェントが与えられたタスクを正しく完了した割合です。エージェントの性能を評価する基本的な指標です。
ツール選択精度	エージェントが利用可能なツールの中から適切なものを選択できた割合です。
トークン効率	エージェントがタスクを完了する際に消費するトークン数の効率性です。少ないトークンで正確な結果を出すほど効率が高いと評価されます。
短期メモリ	エージェントが現在のセッション内で保持する一時的な情報です。会話履歴や直近の作業結果などが該当します。
長期メモリ	エージェントがセッションをまたいで保持する永続的な情報です。過去の対話内容や学習結果などを参照できます。

テキストAI

用語	説明
Answer Relevance	RAGの評価指標の一つで、生成された回答が質問にどの程度関連しているかを測定します。
Anthropic API	Anthropicが提供するClaude系モデルのAPIです。長文処理や推論を組み込んだアプリケーション開発に使われます。
BERTScore	BERTの埋め込みを用いてテキストの意味的類似度を評価する指標です。単語の表面的な一致だけでなく意味的な近さも考慮します。
BLEU	機械翻訳の品質を評価する指標です。翻訳結果と正解の翻訳の間のn-gram一致率を計算します。
ChatGPT	OpenAIが提供する対話型生成AIサービスです。文章生成、要約、壁打ち、調査補助など幅広く使われます。
Claude	Anthropicが開発した大規模言語モデルです。長文の理解や論理的推論に強みを持ちます。
Claude Code	AnthropicのAI Claudeをベースにしたコーディング支援CLIツールです。コードの生成・編集・デバッグを自然言語で指示できます。
CodeBLEU	コード生成の品質を評価する指標です。生成されたコードの構文的・意味的正確さを測定します。
Codex	OpenAIのコード生成・補助向けモデル／製品群です。プログラミング支援や自動化で活用されます。
Context Precision	RAGの評価指標の一つで、検索されたコンテキストのうち関連する情報がどの程度上位に含まれているかを測定します。
Cursor	AIコード補完・編集機能を搭載したコードエディタです。プロジェクト全体のコードを理解した上でコード生成・リファクタリングを支援します。
DeepSeek	中国発の生成AIモデル／サービスです。コード生成、数学、論理推論に強みがあります。
Faithfulness	RAGの評価指標の一つで、生成された回答が参照したコンテキストに忠実であるかを測定します。
Few-shot	プロンプト内にいくつかの例を示すことで、AIの出力形式や内容を制御する手法です。例示の数が少ないため効率的です。
Gemini	Googleが開発したマルチモーダル生成AIモデルです。テキスト・画像・音声などを統合的に処理できます。
GitHub Copilot	GitHubとOpenAIが開発したAIコーディング支援ツールです。コードの文脈からリアルタイムに補完・生成を行い、VS Codeなどのエディタに統合されます。
GPT	Generative Pre-trained Transformerの略で、OpenAIが開発した大規模言語モデルのシリーズです。テキスト生成、要約、翻訳など幅広い用途に利用されます。
Hugging Face	オープンソースのAIモデルやデータセットを共有・公開するプラットフォームです。モデル探索やファインチューニングに広く使われます。
JSON	JavaScript Object Notationの略で、データを構造化して記述するフォーマットです。APIの入出力や設定ファイルで広く使われます。
JSON出力	AIの出力をJSON形式で制御・取得する手法です。構造化データの抽出やAPI連携に活用されます。
Kimi	Moonshot AIが提供する対話型AIです。長文読解や大量PDFの処理に強みがあります。
LangChain	LLMを使ったアプリケーション構築を支援するPythonフレームワークです。RAG・エージェント・ツール連携などの実装を効率化する豊富なモジュールを提供します。
LLM	Large Language Modelの略で、大規模言語モデルのことです。大量のテキストデータで学習し、自然言語の理解と生成を行います。
LoRA	既存モデルに少量の追加パラメータだけを学習させる軽量な追加学習手法です。テキストAI・画像AIの両方で広く使われ、少ない計算資源でモデルをカスタマイズできます。
OpenAI API	OpenAIのGPT系モデルをAPI経由で利用できるサービスです。チャット、構造化出力、コード補助などに使われます。
pass@k	コード生成の評価指標です。k個の生成コードのうち少なくとも1つが正解である確率を表します。
PEFT	Parameter-Efficient Fine-Tuningの略で、モデルの大部分を固定したまま少量のパラメータだけを追加学習する手法の総称です。LoRAもPEFTの一種です。
Perplexity	言語モデルの予測精度を評価する指標です。値が低いほどモデルがテキストを予測しやすいことを示します。
Perplexity AI	検索と生成AIを組み合わせた対話型検索サービスです。情報収集や出典付き要約に活用されます。
RAG	Retrieval-Augmented Generationの略で、外部のナレッジベースから関連情報を検索し、それを基にAIが回答を生成する仕組みです。
RAGAS	RAGシステムの評価フレームワークです。Faithfulness、Answer Relevance、Context Precisionなどの指標で品質を測定します。
ROUGE	テキスト要約の品質を評価する指標です。生成された要約と正解の要約の間のn-gram重複率を計算します。
Transformer	入力データの全体を一度に処理し、要素間の関係性を学習するニューラルネットワークの構造です。現在の生成AIの多くがこの仕組みを基盤としています。
コンテキストウィンドウ	AIモデルが一度に処理できるテキストの最大長です。この制限を考慮して、プロンプトや参照データの量を設計する必要があります。
システムプロンプト	AIの役割、振る舞い、制約などを定義する指示です。ユーザーの入力とは別に設定され、AIの回答の方向性を制御します。
ストリーミング	AIの回答を1文字ずつ順次受け取る方式です。回答の全容を待たずに表示を開始できるため、ユーザー体験が向上します。
トークン	AIモデルがテキストを処理する際の最小単位です。日本語では1文字が1トークンになることが多く、APIの課金やコンテキストウィンドウの計算に関わります。
ファインチューニング	事前学習済みのモデルを特定の用途やドメインに合わせて追加学習することです。専門用語や文体の調整に活用されます。
プロンプトエンジニアリング	AIに意図した出力を得るためのプロンプトの設計・工夫のことです。指示の書き方や構成によって出力品質が大きく変わります。
ベクトルデータベース	テキストや画像をベクトル化して保存・検索するデータベースです。RAGの基盤技術として活用されます。
会話履歴管理	ユーザーとAIの対話の文脈を保持・参照する仕組みです。コンテキストウィンドウの制限内で重要な情報を維持します。

画像AI

用語	説明
Adobe Firefly	Adobeが提供する画像生成AIです。商用利用に安全なデータで学習されており、CreativeCloudと統合されています。
Canva	デザイン作成サービスです。画像生成AIやテンプレート機能を使ってバナーや資料を効率的に制作できます。
CFGスケール	Classifier Free Guidanceスケールの略で、プロンプトへの従い方の強さを制御するパラメータです。値が高いほど指示に忠実な画像が生成されます。
CLIP	OpenAIが開発した画像とテキストの関連性を理解するモデルです。画像検索やゼロショット分類に活用されます。
CLIPScore	CLIPモデルを用いて生成画像とテキストプロンプトの一致度を評価する指標です。
ComfyUI	Stable Diffusionをノードベースのワークフローで操作できるGUIツールです。複雑な画像生成パイプラインを視覚的に組み立てられます。
ControlNet	Stable Diffusionに構図や姿勢などの条件を追加制御する技術です。エッジ、深度マップ、姿勢図などを入力として画像生成を制御できます。
DALL-E	OpenAIが開発したテキストから画像を生成するAIモデルです。ChatGPTからも利用でき、描写通りの高品質な画像を生成できます。
Dice係数	セグメンテーション結果の重なり具合を評価する指標です。1に近いほど予測と正解が一致していることを示します。
FID	Fréchet Inception Distanceの略で、生成画像の品質と多様性を評価する指標です。値が低いほど本物の画像に近い分布を持つことを示します。
Flux	Black Forest Labsが開発した高品質な画像生成モデルです。Stable Diffusionの後継として注目されており、オープンソース版も公開されています。
img2img	既存の画像を入力として新しい画像を生成する手法です。元画像の構図を保ちながらスタイル変換などに活用されます。
Inpainting	画像の特定領域をAIで再生成・修正する技術です。不要な物体の除去や部分修正に活用されます。
IoU	Intersection over Unionの略で、物体検出の評価指標です。予測領域と正解領域の重なり具合を0〜1で表します。
IPアダプター	参照画像のスタイルやキャラクターを新しい画像に反映させる技術です。少数の画像から一貫したキャラクターを生成できます。
IS	Inception Scoreの略で、生成画像の品質と多様性を評価する指標です。分類器の予測分布の統計量に基づいて計算されます。
LoRA	既存モデルに少量の追加パラメータだけを学習させる軽量な追加学習手法です。テキストAI・画像AIの両方で広く使われ、少ない計算資源でモデルをカスタマイズできます。
mAP	mean Average Precisionの略で、物体検出の総合的な評価指標です。クラスごとの平均適合率をさらに平均した値です。
Midjourney	高品質で芸術性の高い画像生成を得意とするAIサービスです。イラストやコンセプトアート制作で広く使われます。
mIoU	mean Intersection over Unionの略で、セグメンテーションの評価指標です。クラスごとのIoUを平均した値です。
OpenAI API	OpenAIのGPT系モデルをAPI経由で利用できるサービスです。チャット、構造化出力、コード補助などに使われます。
OpenCV	画像処理・コンピュータビジョン向けの定番ライブラリです。前処理、認識、映像解析など幅広く利用されます。
Pillow	Pythonで画像の読み書き・加工を行うためのライブラリです。画像前処理や変換処理でよく使われます。
Precision	適合率のことです。検出した物体のうち、正しく検出できた割合を表します。
Recall	再現率のことです。実際の物体のうち、検出できた割合を表します。
Replicate	さまざまなAIモデルをAPI経由で実行できるプラットフォームです。画像・音声・映像モデルの試用や組み込みに向いています。
SAM	Segment Anything Modelの略で、画像内の任意の領域をセグメンテーションできるモデルです。Inpaintingの前処理などに活用されます。
Stability AI API	Stability AIが提供する画像生成APIです。Stable Diffusion系モデルをアプリケーションから利用できます。
Stable Diffusion	オープンソースの画像生成モデルです。LoRAやControlNetを組み合わせた柔軟なカスタマイズが可能です。
Upscaling	画像の解像度を上げる技術です。低解像度の画像を高解像度に変換し、画質を向上させます。
YOLO	You Only Look Onceの略で、リアルタイム物体検出モデルのシリーズです。高速かつ高精度な検出が可能です。
シード値	乱数の初期値です。同じシード値を指定すると同じ出力が再現されるため、結果の再現性確認に活用されます。
スタイルプロンプト	画像の画風や雰囲気を指定するプロンプトの記述です。「水彩風」「サイバーパンク風」などの表現で出力を制御します。
セグメンテーション	画像内の特定領域をピクセル単位で検出・分離する技術です。SAMなどが代表的です。
ネガティブプロンプト	画像生成において「出力したくない要素」を指定するプロンプトです。不要な要素の排除に活用されます。
ノイズ除去	拡散モデルでノイズから徐々に意味のある画像を復元する処理です。画像生成の基本原理として重要です。
参照画像	画像生成の際にスタイルや構図の参考として入力する画像です。IPアダプターなどと組み合わせて活用されます。
強度（strength）	img2imgで元画像をどの程度変化させるかを制御するパラメータです。0に近いほど元画像を維持し、1に近いほど大きく変化します。
拡散モデル	ノイズから徐々に画像を生成する手法です。現在の画像生成AIの主流技術であり、高品質な画像を生成できます。
物体検出	画像内の物体の位置と種類を同時に特定する技術です。バウンディングボックスで位置を、クラスラベルで種類を表します。
画像分類	画像がどのカテゴリに属するかを判定する技術です。犬や猫の識別、シーンの分類などに使われます。

3D・空間AI

用語	説明
3D Gaussian Splatting	点群データをガウシアン分布で表現し、高品質な3Dシーンを再構成する技術です。NeRFより高速なレンダリングが可能です。
ARCore	Googleが提供するAR開発フレームワークです。AndroidデバイスでARアプリを構築できます。
ARKit	Appleが提供するAR開発フレームワークです。iOSデバイスでARアプリを構築できます。
Azure Kinect	Microsoftが提供する深度カメラデバイスです。3D計測や骨格推定、空間認識に活用されます。
Blender	オープンソースの3Dモデリング・アニメーションソフトです。生成した3Dアセットの編集や仕上げに使われます。
Chamfer Distance	2つの点群間の距離を測定する指標です。3D生成モデルの形状精度評価に使われます。
CloudCompare	点群や3Dメッシュの比較・編集・解析を行えるオープンソースソフトウェアです。点群処理の確認や前処理に活用されます。
EMD	Earth Mover’s Distanceの略で、2つの分布間の距離を測定する指標です。3D点群の比較に用いられます。
FBX	Autodeskが開発した3Dモデルのファイル形式です。アニメーションやスキニングデータを含められ、ゲームエンジンで広く使われます。
FID-3D	3D生成モデルの品質を評価する指標です。2D画像のFIDを3Dに拡張したものです。
GLB	3Dモデルのファイル形式の一つです。テクスチャやアニメーションを1ファイルに格納でき、Web表示に適しています。
Intel RealSense	Intelが提供する深度カメラシリーズです。3Dスキャンや空間認識の入力デバイスとして使われます。
iPhone LiDAR	iPhone Proシリーズなどに搭載される距離計測センサーです。空間スキャンや深度取得に利用されます。
LiDAR	レーザー光を用いて物体までの距離を測定するセンサーです。高精度な3D点群データの取得に使われます。
LPIPS	Learned Perceptual Image Patch Similarityの略で、人間の知覚に近い画像類似度を評価する指標です。
Luma AI	写真や動画から3Dシーンを再構成できるサービスです。NeRFや空間再構成の代表的なツールです。
Meshy	テキストや画像から3Dモデルを生成できるAIサービスです。テクスチャ生成にも対応しています。
Meshy API	Meshyの3D生成機能を外部アプリから利用するためのAPIです。テキストや画像から3Dモデルを生成できます。
model-viewer	Web上で3Dモデルを簡単に表示できるWebコンポーネントです。GLBやUSDZの埋め込み表示に適しています。
NeRF	Neural Radiance Fieldsの略で、複数の画像から3Dシーンを再構成する技術です。高品質な新規視点合成が可能です。
OBJ	3Dモデルのファイル形式の一つです。頂点、面、テクスチャ座標などをテキストで記述し、広く互換性があります。
Open3D	3Dデータ処理向けのオープンソースライブラリです。点群、メッシュ、再構成処理などに使われます。
PBR	Physically Based Renderingの略で、物理的に正確な光の振る舞いを再現するレンダリング手法です。リアリティの高い3D表現に不可欠です。
PCL	Point Cloud Libraryの略で、点群処理向けの代表的なC++ライブラリです。3D計測や点群解析で利用されます。
Polycam	スマートフォンで3Dスキャンを行えるアプリです。写真やLiDARから手軽に3Dデータを生成できます。
Potree	大規模点群をWebブラウザ上で表示・操作できるオープンソースビューアです。点群可視化に特化しています。
PSNR	Peak Signal-to-Noise Ratioの略で、画像の品質を評価する指標です。元画像と再構成画像の差分を信号対雑音比で表します。
React Three Fiber	ReactでThree.jsを扱うためのライブラリです。Webアプリに3D表現を組み込みやすくします。
Shap-E	OpenAIが公開したテキスト・画像から3D形状を生成する研究モデルです。3D生成の基礎研究で参照されます。
SSIM	Structural Similarity Indexの略で、画像の構造的類似性を評価する指標です。人間の知覚に近い品質評価が可能です。
STL	3Dモデルのファイル形式の一つです。主に3Dプリント用のデータ形式として使われます。
Three.js	Webブラウザ上で3Dグラフィックスを描画するJavaScriptライブラリです。インタラクティブな3D表現に広く使われます。
Tripo3D	テキストや画像から3Dモデルを生成できるサービスです。APIも提供されています。
Tripo3D API	Tripo3Dの3Dモデル生成機能をアプリケーションから利用するためのAPIです。
Unity	ゲームやXR体験の開発に使われるリアルタイム3Dエンジンです。生成3Dアセットの活用先として代表的です。
Unreal Engine	高品質なゲームや映像表現を制作できるリアルタイム3Dエンジンです。3Dアセットの活用やシミュレーションに使われます。
USDZ	AppleとPixarが開発した3Dモデルのファイル形式です。AR用途に最適化されており、iOSで直接表示できます。
UV展開	3Dモデルの表面を2D平面に展開し、テクスチャを貼り付けるためのマッピング手法です。
WebGL	ブラウザでGPUを使った3D描画を行うための標準技術です。Three.jsなどの基盤として利用されます。
WebXR	ブラウザ上でVR/AR体験を提供するためのAPIです。XRデバイスとの連携に使われます。
深度カメラ	物体までの距離を測定できるカメラです。3D点群データの取得に活用されます。
点群	3D空間内の点の集合で物体や空間を表現するデータ形式です。LiDARや深度カメラで取得されます。

音声AI

用語	説明
ASR	Automatic Speech Recognitionの略で、音声を自動的にテキストに変換する技術の総称です。
CER	Character Error Rateの略で、音声認識の精度を評価する指標です。文字単位で誤り率を計算します。日本語の評価に適しています。
EER	Equal Error Rateの略で、話者認識や生体認識の評価指標です。誤受入率と誤拒否率が等しくなる点の値を表します。
ElevenLabs	高品質な音声合成・ボイスクローンサービスです。感情豊かな音声生成と多言語対応が強みで、APIも提供しています。
ElevenLabs API	ElevenLabsの音声合成・音声関連機能を利用できるAPIです。高品質な読み上げや音声クローンに使われます。
LoRA	既存モデルに少量の追加パラメータだけを学習させる軽量な追加学習手法です。テキストAI・画像AIの両方で広く使われ、少ない計算資源でモデルをカスタマイズできます。
MOS	Mean Opinion Scoreの略で、音声品質を人間の主観評価で5段階で評価する指標です。
OpenAI API	OpenAIのGPT系モデルをAPI経由で利用できるサービスです。チャット、構造化出力、コード補助などに使われます。
OpenAI TTS	OpenAIが提供するテキスト読み上げAPIです。自然な音声で複数の声質から選択でき、リアルタイム生成にも対応しています。
PESQ	Perceptual Evaluation of Speech Qualityの略で、音声の知覚品質を客観的に評価する指標です。
RVC	Retrieval-based Voice Conversionの略で、少量の音声サンプルから話者の声を学習し、別の音声に変換するオープンソースツールです。配信やVTuber文化で広く使われます。
STOI	Short-Time Objective Intelligibilityの略で、音声の明瞭度を客観的に評価する指標です。音声がどの程度聞き取りやすいかを0〜1の値で表します。
STT	Speech to Textの略で、音声をテキストに変換する技術です。ASRと同義で使われます。
TTS	Text to Speechの略で、テキストから音声を合成する技術です。ナレーション生成や音声アシスタントに活用されます。
VOICEVOX	日本語特化の無料音声合成ソフトウェアです。キャラクターごとに異なる声質を持ち、動画ナレーションに広く利用されます。
Web Speech API	ブラウザで音声認識や音声合成を扱うためのWeb APIです。Webアプリへの音声機能実装に利用されます。
WebSocket	双方向通信を継続的に行うための通信方式です。リアルタイム音声認識やストリーミング生成で使われます。
WER	Word Error Rateの略で、音声認識の精度を評価する指標です。単語単位で誤り率を計算します。
Whisper	OpenAIが開発した高精度な音声認識モデルです。多言語対応で音声文字起こしに広く使われます。
ストリーミング	AIの回答を1文字ずつ順次受け取る方式です。回答の全容を待たずに表示を開始できるため、ユーザー体験が向上します。
ピッチ	音の高さを表すパラメータです。音声合成で声の高さを調整する際に使用します。
ボイスクローン	少量の音声サンプルから特定の話者の声を再現する技術です。ナレーションやキャラクター音声の生成に活用されます。
ボイスコンバージョン	ある話者の音声を別の話者の音声に変換する技術です。RVCなどが代表的です。
感情合成	テキストやコンテキストに応じて感情を込めた音声を生成する技術です。
話者類似度	生成音声が元の話者の声にどの程度似ているかを評価する指標です。ボイスクローンの品質評価に使われます。
話速	音声の速さを表すパラメータです。音声合成で読み上げ速度を調整する際に使用します。

音楽・サウンドAI

用語	説明
ACE Studio	AI歌声合成に対応した音楽制作ツールです。ボーカル生成や歌唱表現の調整に使われます。
AIVA	AIによる楽曲作曲を支援するサービスです。映像・ゲーム向けBGM生成に特化しており、商用利用ライセンスも整備されています。
BPM	Beats Per Minuteの略で、音楽のテンポを表す単位です。1分間の拍数で速さを示します。
DAW	Digital Audio Workstationの略で、音楽制作に使うソフトウェアの総称です。録音、編集、ミキシングなどを統合的に行えます。
ElevenLabs API	ElevenLabsの音声合成・音声関連機能を利用できるAPIです。高品質な読み上げや音声クローンに使われます。
FAD	Fréchet Audio Distanceの略で、生成音楽の品質を評価する指標です。音響特徴量の分布を比較して品質を測定します。
FFmpeg	動画・音声の変換・編集を行うコマンドラインツールです。音楽データの形式変換や結合などに広く利用されます。
Inception Score	生成モデルの品質を評価する指標です。生成物の多様性と品質を同時に測定します。
librosa	Pythonで音声解析や特徴量抽出を行うためのライブラリです。音楽情報処理や前処理で広く利用されます。
MIDI	Musical Instrument Digital Interfaceの略で、電子楽器間の演奏データをやり取りする規格です。音符の情報をデジタルで表現します。
MP3	音声データを圧縮するファイル形式です。ファイルサイズを小さくしながら比較的高い音質を維持できます。
MUSHRA	音声品質を主観評価する手法です。複数のサンプルを比較して品質を評価します。
MusicGen	Metaが開発したオープンソースの音楽生成モデルです。テキストや既存音楽を条件に新しい楽曲を生成できます。
pydub	Pythonで音声ファイルの編集・結合・変換を扱いやすくするライブラリです。簡易な音声加工処理に向いています。
Soundraw	BGM制作向けのAI作曲サービスです。長さや雰囲気を指定して楽曲を生成できます。
Stable Audio	Stability AIが提供する音楽・サウンド生成サービスです。テキストプロンプトから高品質な楽曲や効果音を生成できます。
Suno	テキストからボーカル付き楽曲を生成できるAIサービスです。短時間で完成度の高い曲を作れます。
Suno API	Sunoの楽曲生成機能を外部から活用する文脈で参照されるサービス/APIです。テキストから楽曲生成を行います。
SynthV	AIを使った歌声合成ソフトウェアです。日本語を含む多言語に対応しており、リアルな歌声を生成できます。
SynthV API	Synthesizer Vの歌声合成エンジンを外部システムから利用する文脈で参照されるAPI・連携先です。
Tone.js	Web Audio APIを扱いやすくするJavaScriptライブラリです。ブラウザ上での音楽生成や音響制御に使われます。
Transformer	入力データの全体を一度に処理し、要素間の関係性を学習するニューラルネットワークの構造です。現在の生成AIの多くがこの仕組みを基盤としています。
Udio	高品質な楽曲生成を得意とするAIサービスです。ジャンルや雰囲気を細かく指定できます。
VOCALOID	Yamahaが開発した歌声合成技術です。バーチャルシンガー文化を支える代表的な歌声生成基盤です。
WAV	非圧縮の音声ファイル形式です。高品質な音声を保存できますが、ファイルサイズが大きくなります。
Web Audio API	ブラウザで音声生成・加工・再生を行うためのWeb APIです。インタラクティブ音楽や音響表現に活用されます。
WebSocket	双方向通信を継続的に行うための通信方式です。リアルタイム音声認識やストリーミング生成で使われます。
ジャンル	音楽のジャンル（ロック、ジャズ、クラシックなど）のことです。音楽生成プロンプトでスタイルを指定する際に使われます。
拡散モデル	ノイズから徐々に画像を生成する手法です。現在の画像生成AIの主流技術であり、高品質な画像を生成できます。
楽器指定	音楽生成プロンプトで使用する楽器を指定することです。「ピアノとバイオリン」のように具体的に記述します。

映像AI

用語	説明
Accuracy	正確率のことです。全予測のうち正しく予測した割合を表します。
AUC	Area Under the Curveの略で、分類モデルの性能を評価する指標です。ROC曲線の下の面積で表されます。
D-ID	テキストや音声からリップシンク付きのアバター動画を生成するサービスです。多言語対応のプレゼン動画やデジタルヒューマン制作に活用されます。
DeepFake	AIを使って人物の顔や声を入れ替える技術、またはその生成物です。エンターテインメントへの活用と悪用リスクの両面があります。
EbSynth	既存の動画のスタイルを別の画像のスタイルに変換するツールです。映像のスタイル変換に活用されます。
F1スコア	PrecisionとRecallの調和平均です。分類モデルのバランスの取れた性能指標として使われます。
FFmpeg	動画・音声の変換・編集を行うコマンドラインツールです。音楽データの形式変換や結合などに広く利用されます。
FVD	Fréchet Video Distanceの略で、生成映像の品質を評価する指標です。映像の時間的整合性も考慮します。
HeyGen	AIアバターと音声合成を組み合わせた動画生成サービスです。テキストを入力するだけで人物が話す動画を自動生成でき、多言語への翻訳動画作成にも対応しています。
img2video	1枚の画像を入力として動画を生成する手法です。静止画から動きのある映像を作り出せます。
Kling	高品質な動画生成を行える映像AIサービスです。テキストや画像から映像を生成できます。
Kling API	Klingの動画生成機能を外部アプリケーションから利用するためのAPI・連携先です。
Luma Dream Machine	Luma AIが提供するテキスト・画像から動画を生成するサービスです。高品質な映像生成とカメラワーク制御が特徴です。
OpenCV	画像処理・コンピュータビジョン向けの定番ライブラリです。前処理、認識、映像解析など幅広く利用されます。
Pika	テキストや画像から短い動画クリップを生成するAIサービスです。直感的なUIと高品質な映像生成で広く使われています。
PSNR	Peak Signal-to-Noise Ratioの略で、画像の品質を評価する指標です。元画像と再構成画像の差分を信号対雑音比で表します。
Runway	動画生成・編集・映像変換を統合的に扱えるAIプラットフォームです。img2videoや背景除去など多機能です。
Runway API	Runwayの動画生成・映像編集機能を連携利用するためのAPI・サービスです。
SSIM	Structural Similarity Indexの略で、画像の構造的類似性を評価する指標です。人間の知覚に近い品質評価が可能です。
Topaz Video AI	映像の高解像度化やノイズ除去、フレーム補間を行うAI動画編集ソフトです。映像変換・補正に使われます。
Transformer	入力データの全体を一度に処理し、要素間の関係性を学習するニューラルネットワークの構造です。現在の生成AIの多くがこの仕組みを基盤としています。
Video Diffusion	拡散モデルを映像生成に応用した技術です。テキストや画像から動画を生成する際の主流手法です。
WebRTC	Web Real-Time Communicationの略で、ブラウザ間でリアルタイム通信を実現する技術です。カメラ映像の取得や映像チャットに利用されます。
カメラワーク	映像におけるカメラの動きや操作のことです。パン、ズーム、トラッキングショットなどが含まれます。
ズーム	カメラの焦点距離を変えて被写体を近づけたり遠ざけたりする撮影技法です。
パン	カメラを水平方向に回転させる撮影技法です。映像生成のプロンプトでカメラの動きを指定する際に使われます。
フェイススワップ	映像や画像内の人物の顔を別の人物の顔に置き換える技術です。DeepFake技術の代表的な応用です。
リップシンク	音声に合わせて口の動きを自動で生成・同期させる技術です。HeyGenなどのアバター動画生成サービスで活用されます。

身体認識・センシングAI

用語	説明
ARCore	Googleが提供するAR開発フレームワークです。AndroidデバイスでARアプリを構築できます。
ARKit	Appleが提供するAR開発フレームワークです。iOSデバイスでARアプリを構築できます。
Canvas	HTML5の描画APIです。ブラウザ上でグラフィックスを描画し、リアルタイムの映像処理結果を表示するのに使われます。
CSI	Channel State Informationの略で、WiFi信号の伝搬状態を示す情報です。WiFiセンシングで人物検出に活用されます。
DeepFace	顔認識・表情認識のオープンソースライブラリです。年齢推定や感情分析なども可能です。
EER	Equal Error Rateの略で、話者認識や生体認識の評価指標です。誤受入率と誤拒否率が等しくなる点の値を表します。
F1スコア	PrecisionとRecallの調和平均です。分類モデルのバランスの取れた性能指標として使われます。
mAP	mean Average Precisionの略で、物体検出の総合的な評価指標です。クラスごとの平均適合率をさらに平均した値です。
MediaPipe	Googleが開発した骨格推定・ジェスチャー認識ライブラリです。Web・モバイル両対応でリアルタイム処理が可能です。
ml5.js	ブラウザ上で機械学習を簡単に使えるJavaScriptライブラリです。初心者向けのAPIで画像分類や姿勢推定が可能です。
MoveNet	Googleが開発した軽量な姿勢推定モデルです。モバイル端末でも高速に動作します。
OKS	Object Keypoint Similarityの略で、骨格推定の精度を評価する指標です。関節位置の予測精度を測定します。
OpenPose	カーネギーメロン大学開発の骨格推定ライブラリです。高精度な全身推定が可能で研究用途に広く使われます。
p5.js	クリエイティブコーディング向けのJavaScriptライブラリです。センサー入力と組み合わせたインタラクティブ作品制作に使われます。
PCKh	Percentage of Correct Keypointsの変種で、骨格推定の精度を評価する指標です。頭部サイズを基準に正解判定を行います。
Pose Estimation	画像や映像から人体の骨格や姿勢を推定する技術です。関節位置を検出して人体の姿勢を認識します。
Rank-1 Accuracy	顔認識などで最も高いスコアの候補が正解だった割合を示す評価指標です。本人識別性能の比較に使われます。
RF-Pose	WiFiの電波信号を用いて壁越しに人物の姿勢を推定する技術です。カメラなしでの姿勢認識が可能です。
RMSE	Root Mean Square Errorの略で、予測値と正解値の差の二乗平均の平方根です。測位精度の評価に使われます。
Rokoko	モーションキャプチャデバイスとソフトウェアを提供するサービスです。身体の動きをキャラクターに反映できます。
TensorFlow.js	ブラウザ上で機械学習モデルを実行できるライブラリです。リアルタイム推論に適しています。
Tobii	視線追跡デバイスを開発する企業、またはその製品です。アイトラッキングによるUI操作や分析に活用されます。
TouchDesigner	リアルタイム映像・音・センサー入力を統合できるメディア制作ソフトです。インタラクティブアートや展示で多用されます。
WebGazer.js	ブラウザ上で視線追跡を実現するJavaScriptライブラリです。Webカメラのみでアイトラッキングが可能です。
WebRTC	Web Real-Time Communicationの略で、ブラウザ間でリアルタイム通信を実現する技術です。カメラ映像の取得や映像チャットに利用されます。
WebXR	ブラウザ上でVR/AR体験を提供するためのAPIです。XRデバイスとの連携に使われます。
WiFiセンシング	WiFiの電波信号を用いて人物の存在や動きを検出する技術です。カメラなしでのモニタリングが可能です。
バイタルサイン検知	呼吸や心拍などの生体情報を非接触で検出する技術です。WiFiセンシングやレーダーなどを活用します。
ランドマーク	人体や顔の特定の位置を示す点です。骨格推定では関節位置、顔認識では目や鼻の位置などがランドマークになります。
信頼度スコア	検出結果の確からしさを0〜1の値で表す指標です。閾値を設けることで誤検出を減らせます。
感情クラス別Accuracy	表情認識で感情カテゴリごとの正解率を個別に評価する指標です。どの感情が認識しやすいかを確認できます。
表情認識	画像や映像から顔の表情や感情を認識する技術です。喜怒哀楽などの感情分類に使われます。
顔認識	画像や映像から顔を検出し、個人を特定する技術です。セキュリティや認証に活用されます。

評価・品質管理

用語	説明
Helicone	LLM APIの利用状況を記録・可視化する監視ツールです。リクエスト・レスポンスのログ管理やコスト追跡に活用されます。
Langfuse	LLMアプリケーションの観測・評価プラットフォームです。トレース記録・プロンプト管理・品質評価を統合的に管理できます。
LangSmith	LangChainの監視・デバッグ・評価プラットフォームです。トレースやフィードバック管理に活用されます。
Promptfoo	プロンプトの品質を自動テスト・比較評価するツールです。複数モデルの横断比較も可能です。
RAGAS	RAGシステムの評価フレームワークです。Faithfulness、Answer Relevance、Context Precisionなどの指標で品質を測定します。
RLHF	Reinforcement Learning from Human Feedbackの略で、人間のフィードバックに基づいてAIモデルを強化学習する手法です。出力の品質向上に活用されます。
ガードレール	AIの出力が安全で適切な範囲を超えないように制限する仕組みです。有害出力の防止やトーンの制御に使われます。
コンテンツフィルタリング	有害、不適切、または望ましくないコンテンツを検出・除外する仕組みです。AI出力の安全性を確保するために使われます。
シード値	乱数の初期値です。同じシード値を指定すると同じ出力が再現されるため、結果の再現性確認に活用されます。
ジェイルブレイク	AIの安全フィルターを回避して、本来禁止されている出力を引き出そうとする操作のことです。AIサービスの脆弱性の一つとして対策が研究されています。
セーフティフィルター	暴力的、差別的、有害な出力を防止するフィルターです。AIサービスの安全性を担保する仕組みです。
ファクトチェック	AIの出力内容が事実に基づいているかを確認することです。ハルシネーションの検出に不可欠です。
プロンプトインジェクション	悪意のある入力でAIの指示を乗っ取ろうとする攻撃です。システムプロンプトの漏洩や意図しない動作を引き起こすリスクがあります。
温度パラメータ	AI出力のランダム性を制御するパラメータです。0に近いほど決定的、1に近いほど多様な出力になります。

インフラ・開発・運用

用語	説明
.env	環境変数を保存する設定ファイルです。APIキーや秘密情報をコードから分離して管理できます。
A/Bテスト	2つのバリアントを比較して効果を検証する手法です。プロンプトやUIの改善効果を定量的に評価できます。
Anthropic API	Anthropicが提供するClaude系モデルのAPIです。長文処理や推論を組み込んだアプリケーション開発に使われます。
Auto Scaling	利用状況に応じてサーバーリソースを自動的に増減する仕組みです。アクセス増加に伴うパフォーマンス低下を防ぎます。
AWS	Amazon Web Servicesの略で、クラウド上でAIアプリやAPIを運用するための各種サービス群です。
BentoML	機械学習モデルをAPIとして配備・運用しやすくするフレームワークです。モデルサービング基盤の構築に向いています。
CI/CD	Continuous Integration/Continuous Deploymentの略で、コードの変更を自動的にテスト・デプロイする仕組みです。
CloudWatch	AWSが提供する監視・運用管理サービスです。ログ収集、メトリクス監視、アラート設定などに利用されます。
conda	Pythonのパッケージ・環境管理ツールです。データサイエンス用途のパッケージ管理に広く使われます。
Docker	アプリケーションをコンテナ化して実行環境を再現しやすくするプラットフォームです。AI開発環境やデプロイで広く使われます。
dotenv	環境変数を.envファイルから読み込む仕組みです。APIキーなどの機密情報をコードに埋め込まずに管理できます。
FastAPI	高速なPython Webフレームワークです。AIモデルのAPIサーバー構築に広く利用されます。
Git	ソースコードやプロンプトの変更履歴を管理するバージョン管理システムです。
GitHub Actions	GitHubのCI/CDサービスです。テストやデプロイの自動化パイプラインを構築できます。
Google AI API	GoogleのGemini系モデルなどをAPI経由で利用するための開発者向けサービスです。
Google Analytics	Webサイトやアプリの利用状況を分析するアクセス解析サービスです。AI機能利用後の行動分析にも活用できます。
Helicone	LLM APIの利用状況を記録・可視化する監視ツールです。リクエスト・レスポンスのログ管理やコスト追跡に活用されます。
Jupyter Notebook	コード、実行結果、可視化、メモを一体で扱える対話型開発環境です。AIの実験や検証で定番です。
Kubernetes	コンテナ化されたアプリケーションのデプロイ・スケーリング・管理を自動化するプラットフォームです。
LangChain	LLMを使ったアプリケーション構築を支援するPythonフレームワークです。RAG・エージェント・ツール連携などの実装を効率化する豊富なモジュールを提供します。
Langfuse	LLMアプリケーションの観測・評価プラットフォームです。トレース記録・プロンプト管理・品質評価を統合的に管理できます。
LangSmith	LangChainの監視・デバッグ・評価プラットフォームです。トレースやフィードバック管理に活用されます。
LlamaIndex	RAG構築を支援するフレームワークです。データの取り込み、インデックス構築、検索・生成を統合的に管理できます。
Node.js	JavaScriptをサーバーサイドで実行できるランタイムです。AI連携アプリやツール開発でも広く使われます。
OpenAI API	OpenAIのGPT系モデルをAPI経由で利用できるサービスです。チャット、構造化出力、コード補助などに使われます。
PDCA	Plan-Do-Check-Actの略で、業務改善のサイクルです。計画→実行→確認→改善を繰り返すことで品質を向上させます。
Promptfoo	プロンプトの品質を自動テスト・比較評価するツールです。複数モデルの横断比較も可能です。
Python	AI開発で最も広く使われるプログラミング言語です。豊富な機械学習ライブラリ資産があります。
python-dotenv	.envファイルから環境変数を読み込むPythonライブラリです。開発時の秘密情報管理を簡単にします。
Sentry	アプリケーションのエラー監視サービスです。エラーの検出、通知、トレースに利用されます。
TorchServe	PyTorchモデルを本番環境で配備・提供するためのモデルサービングツールです。推論APIの運用に使われます。
uv	Rust製の高速Pythonパッケージマネージャーです。pipやvenvの代替として利用されます。
venv	Pythonの標準仮想環境ツールです。プロジェクトごとに独立したPython環境を作成できます。
Vercel	フロントエンド・サーバーレス関数のデプロイプラットフォームです。迅速な公開とプレビューに適します。
クォータ	APIの利用量制限のことです。一定期間内に呼び出せる回数やデータ量の上限を定めます。
トークン課金	AI APIの利用料金をトークン数に基づいて計算する課金方式です。入力と出力で単価が異なることがあります。
バッチAPI	大量のリクエストをまとめて処理するAPIです。リアルタイム性は低いが、コストを抑えて大量処理が可能です。
プロンプトキャッシュ	同一または類似のプロンプトを再利用する際、前回の計算結果を再利用して応答速度とコストを改善する仕組みです。
レートリミット	APIの呼び出し頻度に設けられる制限です。一定時間内にリクエストできる回数の上限を定めます。
ロードバランサー	複数のサーバーにトラフィックを分散する仕組みです。アクセス集中時の負荷分散に利用されます。
使用量監視	APIの呼び出し回数やトークン消費量を継続的に監視することです。コスト管理と異常検知に活用されます。

ローカルAI環境

用語	説明
4bit量子化	モデルのパラメータを4ビットに圧縮する量子化手法です。精度をある程度保ちながらメモリ使用量を大幅に削減できます。
AUTOMATIC1111	Stable Diffusionをローカルで扱うための代表的なWeb UIです。画像生成や各種拡張機能を利用できます。
AWQ	Activation-aware Weight Quantizationの略で、モデルの重みを量子化する手法です。精度を保ちながらモデルを軽量化できます。
Chroma	オープンソースのベクトルデータベースです。RAG構築で埋め込みベクトルの保存・検索に使われます。
ComfyUI	Stable Diffusionをノードベースのワークフローで操作できるGUIツールです。複雑な画像生成パイプラインを視覚的に組み立てられます。
Command R	Cohereが提供する企業利用向け大規模言語モデルシリーズです。検索拡張や業務用途で利用されます。
DeepSeek	中国発の生成AIモデル／サービスです。コード生成、数学、論理推論に強みがあります。
Falcon	Technology Innovation Instituteが公開するオープンモデルシリーズです。研究やローカル実行の候補として使われます。
FastAPI	高速なPython Webフレームワークです。AIモデルのAPIサーバー構築に広く利用されます。
Gemma	Googleが公開したオープンソースの軽量LLMシリーズです。ローカル実行に適したサイズで提供されており、研究・開発用途に広く使われます。
GGUF	llama.cppで使用されるモデルのファイル形式です。量子化されたモデルを効率的に保存・読み込みできます。
GLM	智谱AIが展開する大規模言語モデルシリーズです。中国語処理や多言語応用で用いられます。
GPT-OSS	GPT系のオープンソース実装や派生モデル群を指す文脈で使われる呼称です。ローカル実験や研究用途で参照されます。
GPTQ	モデルの重みを量子化する手法の一つです。GPUでの高速推論に適した形式でモデルを軽量化します。
Grok	xAIが提供する大規模言語モデル／AIサービスです。各種推論や対話用途で利用されます。
Hugging Face	オープンソースのAIモデルやデータセットを共有・公開するプラットフォームです。モデル探索やファインチューニングに広く使われます。
LangChain	LLMを使ったアプリケーション構築を支援するPythonフレームワークです。RAG・エージェント・ツール連携などの実装を効率化する豊富なモジュールを提供します。
Llama	Metaが開発・公開したオープンソースのLLMシリーズです。多くのローカルAI環境で標準的に利用されるベースモデルです。
llama.cpp	C++で実装されたLLM推論エンジンです。GGUF形式の量子化モデルを高速に実行可能で、CPU環境でも動作します。
LlamaIndex	RAG構築を支援するフレームワークです。データの取り込み、インデックス構築、検索・生成を統合的に管理できます。
LM Studio	ローカルでLLMを実行するためのGUIアプリケーションです。モデルのダウンロードから実行・チャットまでを直感的に操作できます。
MiniMax	中国発のAIモデル／サービス群です。マルチモーダルや対話AIの文脈で利用されます。
Mistral	フランスのMistral AIが開発したオープンソースLLMシリーズです。小さいモデルサイズで高い性能を発揮し、ローカル実行に適しています。
Mixtral	Mistral AIが公開するMixture of Experts型のオープンモデルです。高性能なローカル実行候補として知られます。
Nemotron	NVIDIAが展開する大規模言語モデル群です。推論・企業利用向けの候補として扱われます。
Ollama	コマンドラインからローカルLLMを簡単に実行できるツールです。Llama・Mistral・Gemmaなど多数のモデルを一行コマンドで起動できます。
Ollama API	Ollamaで起動したローカルモデルをHTTP経由で利用するためのAPIです。
OpenCode	AIを活用したターミナルベースのコーディング支援ツールです。複数のLLMに対応しており、コスパの良い選択肢として注目されています。
Phi	Microsoftが展開する小型言語モデルシリーズです。軽量でローカル実行しやすいモデルとして注目されています。
Qwen	Alibabaが公開する大規模言語モデルシリーズです。多言語・マルチモーダル対応モデルも提供されています。
RAM	CPUやアプリケーションが一時的に使用する主記憶メモリです。ローカルAIではモデルサイズに応じた十分な容量が必要です。
Stable Diffusion	オープンソースの画像生成モデルです。LoRAやControlNetを組み合わせた柔軟なカスタマイズが可能です。
VRAM	GPUのビデオメモリのことです。ローカルでAIモデルを実行する際、モデルサイズに対して十分なVRAMが必要です。
Whisper	OpenAIが開発した高精度な音声認識モデルです。多言語対応で音声文字起こしに広く使われます。
オフラインRAG	インターネット接続なしでRAGを構築・運用することです。機密データを外部送信せずにAIを活用できます。
オフライン実行	インターネット接続なしでAIモデルを実行することです。プライバシーやセキュリティの観点から重要な機能です。
オープンソースモデル	ソースコードやモデルの重みデータが公開されており、誰でも自由に利用・改変できるAIモデルです。ローカル実行やカスタマイズに適しています。
コスト比較	クラウドAPI利用とローカル実行の費用を比較し、継続利用時の経済性を判断する観点です。
プライバシー	機密情報や個人情報を外部クラウドへ送信せずに扱えるかを判断する観点です。ローカル実行の大きな利点になります。
社内データ	社外に持ち出せない文書やナレッジを指します。ローカルAIや閉域環境で活用する対象になります。
量子化	モデルのパラメータを低精度で表現することで、メモリ使用量と計算コストを削減する技術です。4bitや8bit量子化が一般的です。

AI活用イントロダクション

AI活用ロードマップ

AI活用用語集

概要

ダウンロード

内容

AIの基礎理解

データ・知識設計

エージェント・ツール呼び出し

テキストAI

画像AI

3D・空間AI

音声AI

音楽・サウンドAI

映像AI

身体認識・センシングAI

評価・品質管理

インフラ・開発・運用

ローカルAI環境

関連アウトプット