Passa ai contenuti principali

Windows 8.1 Store Apps: Text 2 Speech

Con l’arrivo di Windows 8.1 sono arrivate anche una miriade di API con nuove funzionalità interessanti.

Una di queste, già presente tra le API a disposizione di chi sviluppa per Windows Phone 8, è quella relativa al Text To Speech (TTS), cioè alla possibilità che abbiamo di far “parlare” la nostra Windows Store App.

Per chi conosce le API a disposizione di WP8, le API per Windows 8.1 prevedono un approccio differente.

Le nuove API, dato un testo o un file SSML, permettono di ottenere uno stream audio (vedremo in seguito di che tipo) che, per essere riprodotto, deve essere dato in pasto ad un MediaElement.

La seguente figura mostra il flusso da seguire per far parlare la nostra app:

 

image

Supponendo di avere la seguente interfaccia XAML (molto semplice):

<Page
    x:Class="Text2Speech.MainPage"
    xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
    xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
    xmlns:local="using:Text2Speech"
    xmlns:d="http://schemas.microsoft.com/expression/blend/2008"
    xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"
    mc:Ignorable="d">

    <Grid Background="{StaticResource ApplicationPageBackgroundThemeBrush}">
        <Grid.RowDefinitions>
            <RowDefinition Height="Auto"/>
            <RowDefinition Height="Auto"/>
            <RowDefinition Height="*"/>
        </Grid.RowDefinitions>
        <TextBox Name="txtText" Grid.Row="0" HorizontalAlignment="Left" TextWrapping="Wrap" Text="TextBox" VerticalAlignment="Top" Width="200" Margin="10"/>
        <Button Grid.Row="1" Content="Text2Speech" HorizontalAlignment="Left" VerticalAlignment="Top" Margin="10" Click="Button_Click"/>
        <MediaElement x:Name="Audio"/>
    </Grid>
</Page>

 

Il codice necessario per far pronunciare, nella lingua di default, il testo inserito nel textbox è il seguente:

Using synth = New Windows.Media.SpeechSynthesis.SpeechSynthesizer
    Dim synthStream As Windows.Media.SpeechSynthesis.SpeechSynthesisStream
    Try
        synthStream = Await synth.SynthesizeTextToStreamAsync(txtText.Text)
    Catch ex As Exception
        synthStream = Nothing
    End Try
    If synthStream Is Nothing Then
        Dim dialog = New MessageDialog("Error during Synthetize")
        Await dialog.ShowAsync()
    Else
        Audio.AutoPlay = True
        Audio.SetSource(synthStream, synthStream.ContentType)
        Audio.Play()
    End If
End Using

 

La classe da utilizzare per “sintetizzare” il testo è la SpeechSynthesizer.

Utilizzando il metodo SynthesizeTextToStreamAsync (rigorosamente asincrono), otteniamo lo stream di sintesi vocale (di tipo SpeechSynthesisStream) che possiamo impostare come sorgente di un MediaElement e riprodurlo.

La classe SpeechSynthesizer espone anche il metodo SynthesizeSsmlToStreamAsync per eseguire la sintesi di un file SSML (per lo standard SSML vedere http://www.w3.org/TR/speech-synthesis/) il cui funzionamento è identico al precedente.

Infine, la stessa classe può essere utilizzata per recuperare l’insieme delle lingue disponibili nel sistema. La proprietà statica InstalledVoices restituisce la collezione di VoiceInformation relative a tutte le lingue installate nel sistema. Attualmente ci sono 17 lingue disponibili (ma non l’italiano).

In ogni caso, se volessimo la prima lingua italiana presente nel sistema (qualora esistesse), potremmo scrivere:

Dim voices = Windows.Media.SpeechSynthesis.SpeechSynthesizer.AllVoices

Dim italianVoice = voices.Where(Function(v) v.Language = "it-IT").FirstOrDefault()

 

ItalianVoice e’ un’istanza di classe VoiceInformation al cui interno troviamo le informazioni relative alla voce:

image

Per  impostare la lingua desiderata prima di eseguire lo speech, utilizziamo la proprietà Voice della classe SpeechSynthesizer.

Private Sub SetItalianVoice(synth As Windows.Media.SpeechSynthesis.SpeechSynthesizer)
    Dim voices = Windows.Media.SpeechSynthesis.SpeechSynthesizer.AllVoices
    Dim italianVoice = voices.Where(Function(v) v.Language = "it-IT").FirstOrDefault()
    If italianVoice IsNot Nothing Then
        synth.Voice = italianVoice
    End If
End Sub

 

Per maggiori informazioni sul namespace relativo al Text To Speech, l’indirizzo MSDN è http://msdn.microsoft.com/en-us/library/windows/apps/windows.media.speechsynthesis.aspx

Un esempio (C#, Javascript e C++) è disponibile all’ indirizzo http://code.msdn.microsoft.com/windowsapps/Speech-synthesis-sample-6e07b218

 

Commenti

Post popolari in questo blog

VB.NET: Convertire un file DOC in RTF e PDF con office interop

In questo post vorrei proporvi del codice per poter convertire un file .doc in un file .rtf oppure .pdf utilizzando le API di interoperabilità di Office.Creeremo una classe, DocConverter, che esporrà le due funzionalità sopra citate.Cominciamo con il prevedere un attributo privato della classe che rappresenterà l’applicazione Word che utilizzeremo per la conversione. Creeremo l’istanza dell’attributo privato all’interno del costruttore della classe:PublicSubNew()
IfNot CreateWordApp() Then
ThrowNew ApplicationException("Assembly di interoperabilità con Office non trovato!")
EndIf
EndSub
Private _wordApp As Word.ApplicationClass
ProtectedFunction CreateWordApp() AsBoolean
Dim retval = True
Try
_wordApp = New Word.ApplicationClass()
_wordApp.Visible = False
Catch ex As System.Exception
_wordApp = Nothing
retval = False
EndTry
Return retval
EndFunction

La conversione del file doc sarà effettuata aprendo il file stesso ed eseguendo un’operazione di SaveAs:

Pr…

Tascam DR-05 registratore digitale per tutti

Diverso tempo fa ho acquistato il registratore digitale Tascam DR-05 e, ora, dopo diversi mesi di utilizzo, posso dire la mia a proposito.

Si tratta di un ottimo registratore digitale con microfono stereo che permette di ottenere registrazioni di ottima qualitaà anche in ambienti non perfetti dal punto di vista acustico.

Interessante la possibilità di utilizzare un cavalletto di piccole dimensioni come HAMA Mini treppiede o Mini Cavalletto Universale per tenere il microfono sollevato dal tavolo in fase di registrazione grazie allàattacco universale per macchina fotografica che il microfono ha nella parte inferiore.

Da segnalare anche il menu’ ben fatto e la possibilita’ di utilizzare una scheda SD esterna per memorizzare i file audio. Anche a livello di consumo batterie non e’ niente male. Consiglio l’uso delle alcaline non ricaricabili.

Il mio utilizzo e’ stato prettamente di registrazione di podcast vocali (no musica) ma le recensioni confermano che se la cava egregiamente con la mu…

Cambiare la lingua di Visual Studio 2008

Oggi ho avuto qualche problema installando Windows Mobile 6 Professional SDK Refresh e Windows Mobile 6 Standard SDK Refresh.Scaricati i file di installazione e installati, ho provato a creare un progetto di tipo Windows Mobile 6.0 e mi sono beccato questo errore:Dopo qualche smanettamento abbiamo scoperto (e ringrazio il mitico Matteo per l’aiuto) che il mio Visual Studio 2008, pur essendo in Inglese (prova ne era il fatto che gli hotfix e la SP installata erano nella lingua di Albione) aveva come lingua impostata quella del sistema operativo (italiano).Ovviamente, non avrebbe mai potuto trovare la cartella 1040 (italiano) visto che l’installazione dell’SDK aveva supposto che la lingua del Visual Studio fosse Inglese (1033).La soluzione del problema è duplice:1) Duplicate la cartella 1033 presente nel percorso evidenziato dall’errore e la rinominate 10402) cambiate la lingua di Visual Studio.Per questa ultima eventualità basta andare nel menù Strumenti/Opzioni:e cambiare il linguaggi…