Passa ai contenuti principali

VB.NET: Convertire un file DOC in RTF e PDF con office interop

In questo post vorrei proporvi del codice per poter convertire un file .doc in un file .rtf oppure .pdf utilizzando le API di interoperabilità di Office.

Creeremo una classe, DocConverter, che esporrà le due funzionalità sopra citate.

Cominciamo con il prevedere un attributo privato della classe che rappresenterà l’applicazione Word che utilizzeremo per la conversione. Creeremo l’istanza dell’attributo privato all’interno del costruttore della classe:

Public Sub New() 
    If Not CreateWordApp() Then 
        Throw New ApplicationException("Assembly di interoperabilità con Office non trovato!") 
    End If 
End Sub 
Private _wordApp As Word.ApplicationClass 
Protected Function CreateWordApp() As Boolean 
    Dim retval = True 
    Try 
        _wordApp = New Word.ApplicationClass() 
        _wordApp.Visible = False 
    Catch ex As System.Exception 
        _wordApp = Nothing 
        retval = False 
    End Try 
    Return retval 
End Function


La conversione del file doc sarà effettuata aprendo il file stesso ed eseguendo un’operazione di SaveAs:



Private Function OpenDocument(ByVal oFileName As Object) As Word.Document 
    Dim missing As Object = System.Reflection.Missing.Value 
    Dim aDoc As Word.Document = Nothing 
    Try 
        aDoc = _wordApp.Documents.Open(oFileName, missing, False, _ 
                                       missing, missing, missing, _ 
                                       missing, missing, missing, _ 
                                       missing, missing, False) 
    Catch ex As System.Exception 
        aDoc = Nothing 
    End Try 
    Return aDoc 
End Function
Private Function SaveDocumentAs(ByVal document As Word.Document, _ 
                                ByRef filename As String, _ 
                                ByVal wdSaveFormat As Integer) As DocConverterResult 
    Dim retval As DocConverterResult = DocConverterResult.OK 
    Try 
        document.SaveAs(CType(filename, Object), CType(wdSaveFormat, Object)) 
    Catch ex As System.Exception 
        retval = DocConverterResult.DestinationFileNotCreate 
    Finally 
        document.Close() 
    End Try 
    If Not File.Exists(filename.ToString()) Then 
        retval = DocConverterResult.DestinationFileNotCreate 
        filename = "" 
    End If 
    Return retval 
End Function


A questo punto, implementata la funzionalità di SaveAs, ci basta implementare i due metodi richiamabili dall’esterno per la conversione:



Public Function ConvertToRTF(ByVal fileName As String, _
                             ByRef rtfFileName As String, _
                             Optional ByVal destinationPath As String = "") As DocConverterResult
    Dim retval As DocConverterResult = DocConverterResult.OK
    If _wordApp IsNot Nothing Then
        Dim oFileName As Object = fileName
        Dim aDoc As Word.Document = OpenDocument(oFileName)
        If aDoc IsNot Nothing Then
            If Not String.IsNullOrEmpty(destinationPath) Then
                Dim finfo = New FileInfo(fileName)
                rtfFileName = Path.Combine(destinationPath, finfo.Name.ToLower().Replace(".doc", ".rtf"))
            Else
                rtfFileName = fileName.ToLower().Replace(".doc", ".rtf")
            End If
            retval = SaveDocumentAs(aDoc, rtfFileName, Word.WdSaveFormat.wdFormatRTF)
        End If
    Else
        retval = DocConverterResult.OfficeComponentNotFound
    End If
    Return retval
End Function
Public Function ConvertToPDF(ByVal fileName As String, _
                             ByRef pdfFileName As String, _
                             Optional ByVal destinationPath As String = "") As DocConverterResult
    Dim retval As DocConverterResult = DocConverterResult.OK
    If _wordApp IsNot Nothing Then
        Dim oFileName As Object = fileName
        Dim aDoc As Word.Document = OpenDocument(oFileName)
        If aDoc IsNot Nothing Then
            If Not String.IsNullOrEmpty(destinationPath) Then
                Dim finfo = New FileInfo(fileName)
                pdfFileName = Path.Combine(destinationPath, finfo.Name.ToLower().Replace(".doc", ".pdf"))
            Else
                pdfFileName = fileName.ToLower().Replace(".doc", ".pdf")
            End If
            retval = SaveDocumentAs(aDoc, pdfFileName, wdFormatPDF)
        End If
    Else
        retval = DocConverterResult.OfficeComponentNotFound
    End If
    Return retval
End Function


La classe DocConverter, infine, implementa l’interfaccia IDisposable in modo da poter, nell’evento Dispose(), rilasciare in maniera corretta l’applicazione Word (che compare all’interno del task manager durante lo scope di esecuzione dell’istanza della classe).



Per poter utilizzare l’oggetto Word.ApplicationClass è necessario referenziare la dll Microsoft.Office.Interop.Word.dll (un’istalllazione di Word contiene tale dll) mentre per abilitare il salvataggio in PDF è necessario scaricare il plug-in per office scaricabile dall’indirizzo:



http://www.microsoft.com/downloads/details.aspx?FamilyID=f1fc413c-6d89-4f15-991b-63b07ba5f2e5&DisplayLang=en



Il plug-in funziona su Office 2007.



Un progetto demo con la classe è scaricabile cliccando sulla seguente icona:




 




Commenti

Post popolari in questo blog

Creare uno shortcut con VB.NET

Prendendo spunto da un post comparso sul forum MSDN vorrei proporvi un tip su come creare uno shortcut utilizzando VB.NET.Per poter creare uno shortcut possiamo procedere in due modi: o ci studiamo la struttura del file .lnk e scriviamo una classe che è in grado di ricreare tale struttura oppure utilizziamo Windows Scripting Host.La prima soluzione è percorribile ma laboriosa perchè la struttura di un file lnk non è banale. Chi fosse interessato a vedere come è composto, internamente, un file lnk può scaricare la seguente reference guide (link).Io vorrei proporvi la seconda strada e realizzerò una classe che incapsula l’utilizzo di Windows Scripting Host.L’object model di Windows Scripting Host è contenuto nella dll IWshRuntimeLibrary che può essere referenziata, nel nostro progetto, utilizzando il tab COM della finestra di aggiunta delle reference:Tra gli oggetti che troviamo all’interno della libreria utilizzeremo la classe WshShell e la classe WshShortcut.La prima delle due rappres…

VB.NET for Dummies: Gli Eventi

Vorrei iniziare con questo post una serie dedicata ad aspetti di VB.NET di base che possono essere utile a coloro che si avvicinano al mondo .NET e che, in genere, non vengono trattati a livello base.La serie di post non ha la pretesa di essere assolutamente esaustivi sugli argomenti che tratteròIn questo primo post parleremo degli eventi.Cosa sono e a cosa servonoUn evento è la “notifica” dell’accadimento di qualcosa.Quando, ad esempio, premiamo un bottone della finestra di un’applicazione, dietro le quinte, il bottone stesso “notifica” al mondo circostante che qualcuno, in quell’istante, lo ha premuto.Sta, poi, al mondo circostante preoccuparsi di “intercettare” l’evento stesso per gestirlo (tramite un gestore di evento).Attenzione a non confondere la pressione del tasto con la “notifica” della pressione del tasto: l’evento è la “notifica” dell’accadimento, non l’accadimento stesso.Ma a cosa serve tutto ciò?Utilizzare gli eventi è un modo per disaccoppiare due o più attori del nostr…