L'API Audio & Transcription d'AlphaEdge vous permet de transcrire des fichiers audio en texte. Cette fonctionnalité est optimisée pour offrir des performances élevées et une grande précision.
Cette page vous guide à travers l'utilisation de l'API Audio & Transcription, depuis les bases jusqu'aux cas d'usage avancés.
URL d’appel, hôte et documentation
Utilisez la base URL publique de la passerelle, par ex. https://api-endpoints.alphaedge-ai.com. N’appelez pas la gateway par une adresse IP seule si un nom d’hôte public est requis (sinon 403). La documentation utilisateur est sur https://api-docs.alphaedge-ai.com/ ; la passerelle n’expose pas Swagger / OpenAPI interactif en ligne.
Slug et catalogue
La transcription publique n’expose que le slug alpha-audio-v1 pour cette capacité. GET /models renvoie model_slug et type (audio | ocr) pour chaque entrée du catalogue.
Routes exposées (transcription)
- POST
/models/{model_slug}/transcript— multipart identique ; réponse 200 synchrone ou 202 si la durée audio dépasse le seuil configurable (TRANSCRIPT_AUTO_JOB_THRESHOLD_SECONDS, défaut 60 s). - POST
/models/{model_slug}/transcript/sync— même formulaire ; réponse toujours synchrone 200 si succès (pas de 202 par ce chemin). - POST
/models/{model_slug}/transcript/jobs— file d’attente asynchrone (multipart identique), réponse 202 avec job_id et status_url. - GET
/models/{model_slug}/transcript/jobs/{job_id}— état du job (queued, running, succeeded, failed).