Passa ai contenuti principali

Kinect V2: body index stream

In questo post vedremo come sia possibile capire se, in un determinato punto ripreso dal device Kinect, è presente o meno un essere umano (player).

Nella versione 1.x dell’SDK del Kinect (per il device Kinect V1) l’indice del player presente in un determinato punto x,y dello spazio di fronte al device stesso era fornito dallo stream di profondità (lo potevamo ricavare da una parte dei bytes che ci arrivavamo dal device con la profondità).

Nella nuova versione del device e del suo SDK abbiamo a disposizione un vero e proprio stream che ci fornisce tale informazione.

In particolare, il reader (che vedremo più avanti) ci fornisce un frame nel quale abbiamo ogni byte per punto il cui valore indice:

  • se -1 la non presenza di player;
  • un valore da 0 a 5 indicante l’indice del player.

La risoluzione del frame restituito dal device è, ovviamente, quella del frame di profondità che abbiamo visto nel precedente post e, cioè, 512x424 pixel.

La modalità con cui utilizzare lo stream body index è del tutto analoga a quella vista per l’infrarosso e per la profondità.

Apriamo la connessione al Kinect e ricaviamo il reader:

Sensor = KinectSensor.Default
If Sensor IsNot Nothing Then
    Sensor.Open()

    BodyIndexReader = Sensor.BodyIndexFrameSource.OpenReader()
End If

Per ricevere la notifica della presenza dei frame di body index da elaborare è necessario sottoscriversi all’evento BodyIndexFrameArrived del reader:

If BodyIndexReader IsNot Nothing Then
    AddHandler BodyIndexReader.FrameArrived, AddressOf BodyIndexFrameArrivedHandler
End If

In questo modo, ogni volta che l’SDK avrà a disposizione un frame, ce lo notificherà sollevando l’evento FrameArrived che gestire mo con il gestore:

Private Sub BodyIndexFrameArrivedHandler(sender As Object, e As BodyIndexFrameArrivedEventArgs)
    Dim frameReference = e.FrameReference
    Dim frame As BodyIndexFrame = Nothing
    Try
        frame = frameReference.AcquireFrame()
        If frame IsNot Nothing Then
            BodyIndexFrameDescription = frame.FrameDescription

            frame.CopyFrameDataToArray(BodyIndexData)

            BodyIndexData.CopyBodyIndexDataToPixelsArray(BodyIndexPixels)

            BodyIndexBitMap.WritePixels(New Int32Rect(0, 0, BodyIndexFrameDescription.Width, BodyIndexFrameDescription.Height),
                                Me.BodyIndexPixels, BodyIndexFrameDescription.Width * BytesPerPixel, 0)

        End If
    Catch ex As Exception

    Finally
        If frame IsNot Nothing Then
            frame.Dispose()
        End If
    End Try
End Sub

Recuperiamo il frame tramite il metodo AcquireFrame() della classe BodyIndexFrameReference ottenuta tramite l’argomento dell’evento. Il frame ci permette di avere a disposizione tutte le informazioni relative al frame stesso (proprietà FrameDescription) e di poter copiare i valori (array di byte) all’interno di un nostro arrai grazie al metodo CopyFrameDataToArray.

Una volta ottenuti i byte dell’immagine, ognuno dei quali ci dice se è presente un player e di quale player eventualmente si tratta, possiamo convertirli in un immagine.

Per fare questo implementiamo un semplice extension method che agisce sull’array e restituisce un array di terne RGB associando un colore neutro all’indice –1 (nel nostro caso il grigio chiaro) e un colore ad ogni player index compreso tra 0 e 5:

Public Module BodyIndexExtensions

    Private PlayerColors As List(Of Color) = New List(Of Color) From
            {Colors.Red, Colors.Yellow, Colors.Blue, Colors.Green, Colors.Pink, Colors.White}

    Private NeutralColor As Color = Colors.LightGray

    <Extension>
    Public Sub CopyBodyIndexDataToPixelsArray(bodyIndexData As Byte(), pixelsArray As Byte())
        Dim colorPixelIndex = 0
        For i = 0 To bodyIndexData.Length - 1
            Dim playerIndex = bodyIndexData(i)
            Dim color As Color = NeutralColor
            If playerIndex >= 0 And playerIndex <= 5 Then
                color = PlayerColors(playerIndex)
            End If
            pixelsArray(colorPixelIndex) = color.R
            colorPixelIndex += 1
            pixelsArray(colorPixelIndex) = color.G
            colorPixelIndex += 1
            pixelsArray(colorPixelIndex) = color.B
            colorPixelIndex += 2
        Next
    End Sub
End Module

Per capire l’organizzazione delle classi possiamo fare riferimento al seguente diagramma:

image

Possiamo utilizzare, quindi, lo stream del body index se abbiamo la sola necessità di capire la presenza di qualche player nellàinquadratura e di capire quanti.

Nel prossimo post cominceremo a dare un’occhiata alle funzionalità di skeletal tracking offerte dalla nuova SDK.

Disclaimer: “This is preliminary software and/or hardware and APIs are preliminary and subject to change.”

Technorati Tags: ,,

Commenti

Post popolari in questo blog

VB.NET for Dummies: Gli Eventi

Vorrei iniziare con questo post una serie dedicata ad aspetti di VB.NET di base che possono essere utile a coloro che si avvicinano al mondo .NET e che, in genere, non vengono trattati a livello base. La serie di post non ha la pretesa di essere assolutamente esaustivi sugli argomenti che tratterò In questo primo post parleremo degli eventi. Cosa sono e a cosa servono Un evento è la “notifica” dell’accadimento di qualcosa. Quando, ad esempio, premiamo un bottone della finestra di un’applicazione, dietro le quinte, il bottone stesso “notifica” al mondo circostante che qualcuno, in quell’istante, lo ha premuto. Sta, poi, al mondo circostante preoccuparsi di “intercettare” l’evento stesso per gestirlo (tramite un gestore di evento). Attenzione a non confondere la pressione del tasto con la “notifica” della pressione del tasto: l’evento è la “notifica” dell’accadimento, non l’accadimento stesso. Ma a cosa serve tutto ciò? Utilizzare gli eventi è un modo per disaccoppiare ...

Alla scoperta del Kinect: presentazioni e convenevoli

Oggi è arrivato un Kinect nuovo nuovo su cui cominciare a fare sperimentazione ed ho, quindi, deciso di condividere tutto ciò che scopro, le cavolate che faccio e i segreti che scopro con chi mi segue. I post che cercherò di scrivere con frequenza sono post di un neofita che si avvicina all’”Aggeggio” e che quindi sono diretti a chi nulla dell’argomento. Gli esperti troveranno noiosi e banali questi post, ma non si può aver tutto dalla vita. Per cominciare, scartato l’”Aggeggio” ho cominciato a preparare l’ambiente di sviluppo: 1) Visual Studio 2010 Ultimate (che uso normalmente ma che non è necessario in quanto si può sviluppare tranquillamente con la express edition); 2) Kinect SDK, scaricabile all’indirizzo http://research.microsoft.com/en-us/um/redmond/projects/kinectsdk/download.aspx 3) DirectX Software Development Kit scaricabile all’indirizzo http://www.microsoft.com/download/en/details.aspx?displaylang=en&id=6812 A questo punto vi basta connettere il Kinect al...

MVP Reconnect …… ovvero quando entri nella “famigghia” resti sempre nella “famigghia”!!!

Ma di che “famigghia” stiamo parlando!!!! Fermi tutti, non si tratta di robe strane o sette segrete o affari malavitosi….stiamo parlando della grande famiglia dei Microsoft MVP. Per chi non sapesse cosa sono i Microsoft MVP, vi consiglio di fare un giro sul sito ufficiale del programma ( link ), ma, volendolo spiegare in pochisime parole, si tratta di un riconoscimento che Microsoft da a persone che si distinguono per il loro impegno, aiutando gli altri ad ottenere il massimo grazie alle tecnologie Microsoft. Si tratta di persone, non dipendenti Microsoft, che mettono la loro passione, il loro tempo, la loro buona volontà per la divulgazione e la condivisione della conoscenza. Non necessariamente (come qualcuno erroneamente sostiene, evidentemente non conoscendo le basi del programma) si tratta di professionisti nel termine letterale del termine ma si tratta comunque di un gruppo di persone che sacrifica un pò del suo tempo (e, a volte, vi assicuro neanche pò!!!) per la sua passione....