Groq

セットアップなしで Weave 上の Groq モデルを試してみたいですか？ LLM Playground をお試しください。

Groq は、高速な AI 推論を提供する AI インフラストラクチャー企業です。 Groq の LPU™ 推論エンジンは、並外れた計算速度、品質、エネルギー効率を実現するハードウェアおよびソフトウェアプラットフォームです。 Weave は、 Groq のチャットコンプリーション（chat completion）呼び出しを使用して行われた呼び出しを自動的に追跡し、ログを記録します。

Tracing

開発中およびプロダクションの両方において、言語モデルアプリケーションのトレースを中央の場所に保存することは重要です。これらのトレースはデバッグに役立ち、アプリケーションを改善するためのデータセットとしても活用できます。 Weave は Groq のトレースを自動的にキャプチャします。追跡を開始するには、 weave.init(project_name="<YOUR-WANDB-PROJECT-NAME>") を呼び出し、通常通りライブラリを使用してください。

import os
import weave
from groq import Groq

# Weaveを初期化
weave.init(project_name="groq-project")

client = Groq(
    api_key=os.environ.get("GROQ_API_KEY"),
)
chat_completion = client.chat.completions.create(
    messages=[
        {
            "role": "user",
            "content": "Explain the importance of fast language models",
        }
    ],
    model="llama3-8b-8192",
)


Weave は、 Groq ライブラリを介して行われたすべての LLM 呼び出しを追跡し、ログを記録します。 Weave のウェブインターフェースでトレースを確認できます。

独自の op を追跡する

関数を @weave.op でラップすると、入力、出力、アプリケーションロジックのキャプチャが開始され、アプリケーション内でどのようにデータが流れているかをデバッグできるようになります。 op を深くネストして、追跡したい関数のツリーを構築できます。これにより、実験中に git にコミットされていないアドホックな詳細をキャプチャするために、コードのバージョン管理も自動的に開始されます。 @weave.op でデコレートされた関数を作成するだけです。以下の例では、 recommend_places_to_visit という関数があります。これは、都市の観光スポットを推薦する @weave.op でラップされた関数です。

import os
import weave
from groq import Groq

# プロジェクトの初期化
weave.init(project_name="groq-test")

client = Groq(
    api_key=os.environ.get("GROQ_API_KEY"),
)

@weave.op()
def recommend_places_to_visit(city: str, model: str="llama3-8b-8192"):
    chat_completion = client.chat.completions.create(
        messages=[
            {
                "role": "system",
                "content": "You are a helpful assistant meant to suggest places to visit in a city",
            },
            {
                "role": "user",
                "content": city,
            }
        ],
        model="llama3-8b-8192",
    )
    return chat_completion.choices[0].message.content

# 関数の呼び出し
recommend_places_to_visit("New York")
recommend_places_to_visit("Paris")
recommend_places_to_visit("Kolkata")


`recommend_places_to_visit` 関数を `@weave.op` でデコレートすることで、その入力、出力、および関数内で行われたすべての内部 LM 呼び出しがトレースされます。

実験を容易にするための `Models` の作成

多くの要素が動いている場合、実験の整理は困難になります。 Models クラスを使用すると、システムプロンプトや使用しているモデルなど、アプリケーションの実験的な詳細をキャプチャして整理できます。これにより、アプリケーションの異なるイテレーションの整理や比較が容易になります。コードのバージョン管理や入力/出力のキャプチャに加えて、 Models はアプリケーションの振る舞いを制御する構造化されたパラメータをキャプチャし、どのパラメータが最適であったかを簡単に見つけられるようにします。また、 Weave Models は serve や Evaluations と併用することもできます。以下の例では、 GroqCityVisitRecommender を使って実験ができます。これらを変更するたびに、 GroqCityVisitRecommender の新しい「バージョン」が作成されます。

import os
from groq import Groq
import weave


class GroqCityVisitRecommender(weave.Model):
    model: str
    groq_client: Groq

    @weave.op()
    def predict(self, city: str) -> str:
        system_message = {
            "role": "system",
            "content": """
You are a helpful assistant meant to suggest places to visit in a city
""",
        }
        user_message = {"role": "user", "content": city}
        chat_completion = self.groq_client.chat.completions.create(
            messages=[system_message, user_message],
            model=self.model,
        )
        return chat_completion.choices[0].message.content


weave.init(project_name="groq-test")
city_recommender = GroqCityVisitRecommender(
    model="llama3-8b-8192", groq_client=Groq(api_key=os.environ.get("GROQ_API_KEY"))
)
print(city_recommender.predict("New York"))
print(city_recommender.predict("San Francisco"))
print(city_recommender.predict("Los Angeles"))


`Models` を使用した呼び出しのトレースとバージョン管理

Weave モデルのサービング

任意の weave.Model オブジェクトへの Weave リファレンスがあれば、 FastAPI サーバーを立ち上げて serve することができます。


WeaveModel の Weave リファレンスは、 UI でモデルに移動してコピーすることで取得できます。

ターミナルで以下のコマンドを使用してモデルをサービングできます。

weave serve weave://your_entity/project-name/YourModel:<hash>

Get Started

Guides

Cookbooks

Reference

Open Source

Community

Tracing

独自の op を追跡する

実験を容易にするための `Models` の作成

Weave モデルのサービング

Get Started

Guides

Cookbooks

Reference

Open Source

Community

Documentation Index

​Tracing

​独自の op を追跡する

​実験を容易にするための Models の作成

​Weave モデルのサービング

Tracing

独自の op を追跡する

実験を容易にするための `Models` の作成

Weave モデルのサービング