L'API Responses introduit une approche révolutionnaire pour gérer les interactions complexes avec les modèles IA. Contrairement aux API traditionnelles, elle offre un modèle de conversation stateful, éliminant le besoin de gestion manuelle de l'état. Ce guide vous accompagnera à travers les étapes essentielles pour exploiter efficacement l'API Responses.

Pour commencer

Tout d'abord, assurez-vous d'avoir le package Python OpenAI installé et votre clé API prête.

from openai import OpenAI
import os
 
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

Créer une réponse

Pour initier une conversation, utilisez la méthode responses.create. Voici comment demander au modèle de raconter une blague :

response = client.responses.create(
    model="gpt-4o-mini",
    input="raconte-moi une blague",
)
print(response.output[0].content[0].text)

Conversations stateful

L'une des fonctionnalités clés de l'API Responses est sa nature stateful. Vous pouvez récupérer l'historique complet de la conversation à tout moment :

fetched_response = client.responses.retrieve(
    response_id=response.id
)
print(fetched_response.output[0].content[0].text)

Continuer les conversations

Pour continuer une conversation, référencez simplement l'ID de la réponse précédente :

response_two = client.responses.create(
    model="gpt-4o-mini",
    input="raconte-m'en une autre",
    previous_response_id=response.id
)
print(response_two.output[0].content[0].text)

Outils hébergés

L'API Responses prend en charge des outils hébergés comme web_search, permettant une intégration fluide des résultats de recherche web dans vos conversations :

response = client.responses.create(
    model="gpt-4o",
    input="Quelles sont les dernières nouvelles sur l'IA ?",
    tools=[
        {
            "type": "web_search"
        }
    ]
)
import json
print(json.dumps(response.output, default=lambda o: o.__dict__, indent=2))

Interactions multimodales

L'API prend en charge nativement le texte, les images et l'audio, permettant des interactions riches et multimodales :

response_multimodal = client.responses.create(
    model="gpt-4o",
    input=[
        {
            "role": "user",
            "content": [
                {"type": "input_text", "text": "Proposez des mots-clés liés à l'image, et recherchez sur le web en utilisant l'outil de recherche pour toute actualité liée aux mots-clés, résumez les résultats et citez les sources."},
                {"type": "input_image", "image_url": "https://upload.wikimedia.org/wikipedia/commons/thumb/1/15/Cat_August_2010-4.jpg/2880px-Cat_August_2010-4.jpg"}
            ]
        }
    ],
    tools=[
        {"type": "web_search"}
    ]
)
import json
print(json.dumps(response_multimodal.__dict__, default=lambda o: o.__dict__, indent=4))

Conclusion

L'API Responses simplifie le développement d'interactions complexes, multimodales et augmentées par des outils. En gérant l'état et en intégrant des outils hébergés, elle réduit le besoin de multiples appels API et de gestion manuelle de l'état, rendant votre code plus propre et plus efficace.

Prêt à simplifier vos interactions IA ? Plongez dans la documentation de l'API Responses et commencez à construire dès aujourd'hui !