Add speech-runner: Swift inference for Whisper model by carinapeng · Pull Request #54 · apple/coreai-models

carinapeng · 2026-06-17T19:49:43Z

Purpose

Swift CLI that loads a CoreAI Whisper export and transcribes audio

Changes

swift/Sources/Tools/speech-runner/SpeechRunnerMain.swift — loads either export format, greedy decodes with forced prefix + KV cache, decodes tokens to text via bundled tokenizer
swift/Sources/Tools/speech-runner/WhisperMel.swift — mel spectrogram computation in Swift
Package.swift — registers speech-runner target

Testing

Usage
swift run speech-runner <model-path> <audio.flac>

Tested running both converted model from ToT main and reauthored model from branch carina/whisper. No impact on model performance or export quality in this PR

carinapeng added 3 commits June 17, 2026 12:02

Speech runner

98ecaa8

Mel compute in Swift

08cf8f9

Swift formatting

dab7574

carinapeng requested review from alejandro-isaza, kevchengcodes, stikves and tjia1818 June 17, 2026 20:02

carinapeng marked this pull request as draft June 17, 2026 21:14

carinapeng marked this pull request as ready for review June 17, 2026 21:14

carinapeng and others added 3 commits June 18, 2026 13:41

Updates

eeb6992

Swift format

316a710

Merge branch 'main' into carina/speech-runner

18bcd40

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add speech-runner: Swift inference for Whisper model#54

Add speech-runner: Swift inference for Whisper model#54
carinapeng wants to merge 6 commits into
apple:mainfrom
carinapeng:carina/speech-runner

carinapeng commented Jun 17, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

carinapeng commented Jun 17, 2026

Purpose

Changes

Testing

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant