トークンとは？意味と仕組みをやさしく解説

トークンとは？

トークンはLLM（大規模言語モデル）が処理する最小単位で、単語よりも細かく分割されます。英語では約4文字、日本語では約1〜2文字が1トークンの目安です。

LLMのAPI料金や処理量はトークン数で課金され、入力（プロンプト）と出力（生成）の両方がカウントされます。LLMには「コンテキスト長」（一度に扱えるトークン数）の制限もあります。

主要LLMのトークン関連スペックは次のとおりです。

LLMOの観点では、AI回答に引用されるためにはコンテンツが「コンテキストに入る」必要があります。冗長な記事より、要点をコンパクトに伝える文章が引用されやすくなります。

Saguru なら、月額270円から、SEOキーワード調査・上位サイト分析・自サイトSEO診断のすべてが使えます。「トークン」を理解した上で、すぐに実践に移せます。

登録なしで1日5回まで無料／メール登録で1日30回／ベーシック月額270円

日本語と英語でトークン消費は違う？

日本語の方が1文字あたりのトークン消費が多く、英語より約1.5〜2倍コストがかかります。

トークン数を減らす方法は？

冗長な表現を削り、明確で簡潔に書くことです。プロンプト技術ではFew-shotを減らす、要約を活用するなどの工夫があります。

トークン上限を超えるとどうなる？

多くのモデルではエラーになるか、超過分が無視されます。事前にトークン数をカウントするツールで確認しましょう。