Passa ai contenuti principali

Kinect V2: body index stream

In questo post vedremo come sia possibile capire se, in un determinato punto ripreso dal device Kinect, è presente o meno un essere umano (player).

Nella versione 1.x dell’SDK del Kinect (per il device Kinect V1) l’indice del player presente in un determinato punto x,y dello spazio di fronte al device stesso era fornito dallo stream di profondità (lo potevamo ricavare da una parte dei bytes che ci arrivavamo dal device con la profondità).

Nella nuova versione del device e del suo SDK abbiamo a disposizione un vero e proprio stream che ci fornisce tale informazione.

In particolare, il reader (che vedremo più avanti) ci fornisce un frame nel quale abbiamo ogni byte per punto il cui valore indice:

  • se -1 la non presenza di player;
  • un valore da 0 a 5 indicante l’indice del player.

La risoluzione del frame restituito dal device è, ovviamente, quella del frame di profondità che abbiamo visto nel precedente post e, cioè, 512x424 pixel.

La modalità con cui utilizzare lo stream body index è del tutto analoga a quella vista per l’infrarosso e per la profondità.

Apriamo la connessione al Kinect e ricaviamo il reader:

Sensor = KinectSensor.Default
If Sensor IsNot Nothing Then
    Sensor.Open()

    BodyIndexReader = Sensor.BodyIndexFrameSource.OpenReader()
End If

Per ricevere la notifica della presenza dei frame di body index da elaborare è necessario sottoscriversi all’evento BodyIndexFrameArrived del reader:

If BodyIndexReader IsNot Nothing Then
    AddHandler BodyIndexReader.FrameArrived, AddressOf BodyIndexFrameArrivedHandler
End If

In questo modo, ogni volta che l’SDK avrà a disposizione un frame, ce lo notificherà sollevando l’evento FrameArrived che gestire mo con il gestore:

Private Sub BodyIndexFrameArrivedHandler(sender As Object, e As BodyIndexFrameArrivedEventArgs)
    Dim frameReference = e.FrameReference
    Dim frame As BodyIndexFrame = Nothing
    Try
        frame = frameReference.AcquireFrame()
        If frame IsNot Nothing Then
            BodyIndexFrameDescription = frame.FrameDescription

            frame.CopyFrameDataToArray(BodyIndexData)

            BodyIndexData.CopyBodyIndexDataToPixelsArray(BodyIndexPixels)

            BodyIndexBitMap.WritePixels(New Int32Rect(0, 0, BodyIndexFrameDescription.Width, BodyIndexFrameDescription.Height),
                                Me.BodyIndexPixels, BodyIndexFrameDescription.Width * BytesPerPixel, 0)

        End If
    Catch ex As Exception

    Finally
        If frame IsNot Nothing Then
            frame.Dispose()
        End If
    End Try
End Sub

Recuperiamo il frame tramite il metodo AcquireFrame() della classe BodyIndexFrameReference ottenuta tramite l’argomento dell’evento. Il frame ci permette di avere a disposizione tutte le informazioni relative al frame stesso (proprietà FrameDescription) e di poter copiare i valori (array di byte) all’interno di un nostro arrai grazie al metodo CopyFrameDataToArray.

Una volta ottenuti i byte dell’immagine, ognuno dei quali ci dice se è presente un player e di quale player eventualmente si tratta, possiamo convertirli in un immagine.

Per fare questo implementiamo un semplice extension method che agisce sull’array e restituisce un array di terne RGB associando un colore neutro all’indice –1 (nel nostro caso il grigio chiaro) e un colore ad ogni player index compreso tra 0 e 5:

Public Module BodyIndexExtensions

    Private PlayerColors As List(Of Color) = New List(Of Color) From
            {Colors.Red, Colors.Yellow, Colors.Blue, Colors.Green, Colors.Pink, Colors.White}

    Private NeutralColor As Color = Colors.LightGray

    <Extension>
    Public Sub CopyBodyIndexDataToPixelsArray(bodyIndexData As Byte(), pixelsArray As Byte())
        Dim colorPixelIndex = 0
        For i = 0 To bodyIndexData.Length - 1
            Dim playerIndex = bodyIndexData(i)
            Dim color As Color = NeutralColor
            If playerIndex >= 0 And playerIndex <= 5 Then
                color = PlayerColors(playerIndex)
            End If
            pixelsArray(colorPixelIndex) = color.R
            colorPixelIndex += 1
            pixelsArray(colorPixelIndex) = color.G
            colorPixelIndex += 1
            pixelsArray(colorPixelIndex) = color.B
            colorPixelIndex += 2
        Next
    End Sub
End Module

Per capire l’organizzazione delle classi possiamo fare riferimento al seguente diagramma:

image

Possiamo utilizzare, quindi, lo stream del body index se abbiamo la sola necessità di capire la presenza di qualche player nellàinquadratura e di capire quanti.

Nel prossimo post cominceremo a dare un’occhiata alle funzionalità di skeletal tracking offerte dalla nuova SDK.

Disclaimer: “This is preliminary software and/or hardware and APIs are preliminary and subject to change.”

Technorati Tags: ,,

Commenti

Post popolari in questo blog

VB.NET for Dummies: Gli Eventi

Vorrei iniziare con questo post una serie dedicata ad aspetti di VB.NET di base che possono essere utile a coloro che si avvicinano al mondo .NET e che, in genere, non vengono trattati a livello base. La serie di post non ha la pretesa di essere assolutamente esaustivi sugli argomenti che tratterò In questo primo post parleremo degli eventi. Cosa sono e a cosa servono Un evento è la “notifica” dell’accadimento di qualcosa. Quando, ad esempio, premiamo un bottone della finestra di un’applicazione, dietro le quinte, il bottone stesso “notifica” al mondo circostante che qualcuno, in quell’istante, lo ha premuto. Sta, poi, al mondo circostante preoccuparsi di “intercettare” l’evento stesso per gestirlo (tramite un gestore di evento). Attenzione a non confondere la pressione del tasto con la “notifica” della pressione del tasto: l’evento è la “notifica” dell’accadimento, non l’accadimento stesso. Ma a cosa serve tutto ciò? Utilizzare gli eventi è un modo per disaccoppiare ...

VB.NET: SplashScreen con effetto fade-in

In questo post vorrei proporvi un modo per realizzare una splash screen per le nostre applicazioni Windows Form che appare progressivamente con un effetto fade. Supponiamo di avere il nostro progetto VB.NET in una soluzione Visual Studio 2008 in cui abbiamo il sorgente della nostra applicazione Windows Form. Inseriamo una splash screen utilizzando il menù Progetto->Aggiungi Nuovo Elemento e selezionando il tipo di elemento “Schermata Iniziale” A questo punto Visual Studio creerà, automaticamente, la schermata iniziale che possiamo personalizzare graficamente come vogliamo. Per poter fare in modo che questa finestra appaia nel momento in cui avviamo l’applicazione, è necessario aprire le proprietà del progetto e impostare la maschera di avvio: In questo modo, all’avvio dell’applicazione, la schermata appare immediatamente e scompare un attimo prima della visualizzazione della finestra dell’applicazione. Possiamo far apparire la schermata iniziale con un ef...

Alla scoperta del Kinect: presentazioni e convenevoli

Oggi è arrivato un Kinect nuovo nuovo su cui cominciare a fare sperimentazione ed ho, quindi, deciso di condividere tutto ciò che scopro, le cavolate che faccio e i segreti che scopro con chi mi segue. I post che cercherò di scrivere con frequenza sono post di un neofita che si avvicina all’”Aggeggio” e che quindi sono diretti a chi nulla dell’argomento. Gli esperti troveranno noiosi e banali questi post, ma non si può aver tutto dalla vita. Per cominciare, scartato l’”Aggeggio” ho cominciato a preparare l’ambiente di sviluppo: 1) Visual Studio 2010 Ultimate (che uso normalmente ma che non è necessario in quanto si può sviluppare tranquillamente con la express edition); 2) Kinect SDK, scaricabile all’indirizzo http://research.microsoft.com/en-us/um/redmond/projects/kinectsdk/download.aspx 3) DirectX Software Development Kit scaricabile all’indirizzo http://www.microsoft.com/download/en/details.aspx?displaylang=en&id=6812 A questo punto vi basta connettere il Kinect al...