CLS pooling([CLS] pooling)についてわかりやすく整理しますね。
[CLS] を付けます。[CLS] トークンのベクトルを、「文全体の表現(sentence embedding)」として利用する方法を CLS pooling と呼びます。[CLS] を使えるのか?[CLS] ベクトルを使って最終的に分類タスクを解く」ように設計されているため、モデルは自然と [CLS] に文全体の意味を集約するようになります。[CLS] の出力が使われます。CLS pooling
→ [CLS] のベクトルをそのまま使う。
長所: 高速・シンプル。
短所: 文埋め込みの質がタスクによっては不安定になる。
Mean pooling(平均プーリング) → 全トークンのベクトルを平均する。 長所: 安定した意味表現になりやすい。 短所: CLSに比べると計算コストはわずかに増える。
Max pooling(最大プーリング) → 各次元ごとに最大値を取る。 特徴が際立ちやすいが、情報が偏ることもある。
👉 まとめると:
[CLS] の出力ベクトルをそのまま文表現として使う方法ご希望なら、PyTorch / Hugging Face Transformers で CLS pooling と Mean pooling の実装例をコードで書きますか?
Popular topics in this scrapbook:
Other scraps from "k1ito-tech"
いい選択です 👍 diskcache は ディスクにキャッシュを保存できるライブラリ で、メモリを圧迫せずに大量のデータをキャッシュできます。しかも API がシンプルで、Webアプリや機械学習の前処理結果キャッシュなどにもよく使われます。 --- インストール bash pip inst...
If by “MCP server” you mean a server implementing the Model Context Protocol (MCP) to allow LLMs / AI agents to interact with external tools/data sour...
[2508.20722] rStar2-Agent: Agentic Reasoning Technical Report URL: https://www.arxiv.org/abs/2508.20722 Captured: 2025/9/6 17:39:22 --- Computer ...
Daytona Sandbox:開発環境の新たな可能性 Daytona Sandboxとは Daytona Sandboxは、開発者がクラウド上で瞬時に開発環境を構築・共有できる革新的なプラットフォームです。従来のローカル開発環境の制約を取り払い、どこからでもアクセス可能な統一された開発体験...
step-by-step E2B example in Python that shows stateful execution, installing packages, uploading a file, and doing a quick SQLite query—all inside a s...
Agentic workflow patterns integrate modular software agents with structured large language model (LLM) workflows, enabling autonomous reasoning and ac...
Want to create your own articles?
Get Started