Explorer la nouvelle API Responses : Un guide complet

L'API Responses introduit une approche révolutionnaire pour gérer les interactions complexes avec les modèles IA. Contrairement aux API traditionnelles, elle offre un modèle de conversation stateful, éliminant le besoin de gestion manuelle de l'état. Ce guide vous accompagnera à travers les étapes essentielles pour exploiter efficacement l'API Responses.
Pour commencer
Tout d'abord, assurez-vous d'avoir le package Python OpenAI installé et votre clé API prête.
from openai import OpenAI
import os
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))Créer une réponse
Pour initier une conversation, utilisez la méthode responses.create. Voici comment demander au modèle de raconter une blague :
response = client.responses.create(
model="gpt-4o-mini",
input="raconte-moi une blague",
)
print(response.output[0].content[0].text)Conversations stateful
L'une des fonctionnalités clés de l'API Responses est sa nature stateful. Vous pouvez récupérer l'historique complet de la conversation à tout moment :
fetched_response = client.responses.retrieve(
response_id=response.id
)
print(fetched_response.output[0].content[0].text)Continuer les conversations
Pour continuer une conversation, référencez simplement l'ID de la réponse précédente :
response_two = client.responses.create(
model="gpt-4o-mini",
input="raconte-m'en une autre",
previous_response_id=response.id
)
print(response_two.output[0].content[0].text)Outils hébergés
L'API Responses prend en charge des outils hébergés comme web_search, permettant une intégration fluide des résultats de recherche web dans vos conversations :
response = client.responses.create(
model="gpt-4o",
input="Quelles sont les dernières nouvelles sur l'IA ?",
tools=[
{
"type": "web_search"
}
]
)
import json
print(json.dumps(response.output, default=lambda o: o.__dict__, indent=2))Interactions multimodales
L'API prend en charge nativement le texte, les images et l'audio, permettant des interactions riches et multimodales :
response_multimodal = client.responses.create(
model="gpt-4o",
input=[
{
"role": "user",
"content": [
{"type": "input_text", "text": "Proposez des mots-clés liés à l'image, et recherchez sur le web en utilisant l'outil de recherche pour toute actualité liée aux mots-clés, résumez les résultats et citez les sources."},
{"type": "input_image", "image_url": "https://upload.wikimedia.org/wikipedia/commons/thumb/1/15/Cat_August_2010-4.jpg/2880px-Cat_August_2010-4.jpg"}
]
}
],
tools=[
{"type": "web_search"}
]
)
import json
print(json.dumps(response_multimodal.__dict__, default=lambda o: o.__dict__, indent=4))Conclusion
L'API Responses simplifie le développement d'interactions complexes, multimodales et augmentées par des outils. En gérant l'état et en intégrant des outils hébergés, elle réduit le besoin de multiples appels API et de gestion manuelle de l'état, rendant votre code plus propre et plus efficace.
Prêt à simplifier vos interactions IA ? Plongez dans la documentation de l'API Responses et commencez à construire dès aujourd'hui !
Référence
- Web Search and States with Responses API par Bill Chen
Discutez de votre projet avec nous
Nous sommes ici pour vous aider avec vos besoins en développement Web. Planifiez un appel pour discuter de votre projet et comment nous pouvons vous aider.
Trouvons les meilleures solutions pour vos besoins.
Articles connexes
Améliorer l'efficacité du service client : Exploiter les appels d'outils obligatoires dans ChatCompletion
Découvrez comment les appels d'outils obligatoires dans ChatCompletion peuvent améliorer l'efficacité du service client en fournissant des réponses cohérentes et des workflows rationalisés.

Comment surveiller l'utilisation et les coûts OpenAI avec l'API Usage et l'API Cost
Apprenez à utiliser l'API Usage et l'API Cost d'OpenAI pour surveiller votre utilisation et vos coûts OpenAI. Ce guide fournit des instructions étape par étape pour récupérer, analyser et visualiser les données d'utilisation et de coûts.

Passer des appels sortants avec Twilio Voice et OpenAI
Apprenez à passer des appels sortants en utilisant Twilio Voice et l'API Realtime d'OpenAI avec Node.js.