POST /models/{model_slug}/transcript

Slug audio : alpha-audio-v1 uniquement. Multipart : champ fichier obligatoire nommé audio (pas file). Optionnels : enable_diarization, enable_postcorrect (booléens formulaire). POST /models/{slug}/transcript renvoie HTTP 200 (TranscriptResponse) en cas de succès. Le champ interne gateway_wall_ms est exclu du JSON client. Authentification : X-API-Key ou Authorization: Bearer (équivalents).

POST /models/{model_slug}/transcript

Request body

The following parameters can be included in the request body:

Parameters

audio
file
Required

Fichier audio (multipart, nom de champ : audio).

enable_diarization
boolean
Default value: false

Optionnel. Active la diarization.

enable_postcorrect
boolean
Default value: false

Optionnel. Post-correction linguistique du texte ASR : ponctuation, majuscules, orthographe et suppression des répétitions/bégaiements, via un appel à un modèle open source externe hébergé chez Novita. Optimisée pour le français ; ne pas activer hors français. En cas d’indisponibilité côté serveur, le texte ASR brut est renvoyé avec un statut 200 (failsafe).

Successful response

The following fields are returned in a successful response:

Response fields

model_slug
string

Slug du modèle (réponse synchrone).

text
string

Texte transcrit, post-corrigé si enable_postcorrect=true et service disponible.

inference_seconds
number

Temps ASR rapporté par le service amont (en secondes).

enable_diarization
boolean

Écho de la valeur de diarisation effectivement appliquée.

audio_duration_seconds
number

Durée audio détectée.

audio_filename
string null

Nom du fichier audio, ou null.

Examples

Code examples for using this endpoint:

curl
curl -X POST "https://api-endpoints.alphaedge-ai.com/models/alpha-audio-v1/transcript" \
  -H "X-API-Key: TA_CLE" \
  -F "audio=@/chemin/audio.wav" \
  -F "enable_diarization=true"
python
import requests
url = "https://api-endpoints.alphaedge-ai.com/models/alpha-audio-v1/transcript"
headers = {"X-API-Key": "TA_CLE"}
with open("/chemin/audio.wav", "rb") as f:
    files = {"audio": ("audio.wav", f, "audio/wav")}
    data = {
        "enable_diarization": "true",
    }
    r = requests.post(url, headers=headers, files=files, data=data, timeout=300)
print(r.status_code)
print(r.json())
typescript
import fs from "node:fs";
const form = new FormData();
form.append("audio", new Blob([fs.readFileSync("/chemin/audio.wav")]), "audio.wav");
form.append("enable_diarization", "true");
const res = await fetch("https://api-endpoints.alphaedge-ai.com/models/alpha-audio-v1/transcript", {
  method: "POST",
  headers: { "X-API-Key": "TA_CLE" },
  body: form
});
console.log(res.status, await res.json());

Response

Sample API response:

json
HTTP 200 — TranscriptResponse (POST /transcript) :
{
  "model_slug": "alpha-audio-v1",
  "text": "…",
  "inference_seconds": 1.2,
  "enable_diarization": false,
  "audio_duration_seconds": 45.3,
  "audio_filename": "audio.wav"
}