8


0

OOXMLを使用したDocxファイルの比較

docxファイルから(スタイルを使用して)単語単位で読み取るにはどうすればよいですか。 2つのdocxファイルを単語ごとに比較し、別のdocxファイルに書き込む必要がある違いに基づいて(c#とOOXMLを使用して)したいと思います。 DocumentFormat.OpenXml.Extensions.dll _、 OpenXMLdiff.dll_、および_ICSharpCode.SharpZipLib.dll_を使用してこれを達成しようとしましたが、単語ごとに読み取るオプションがありません(ICSharpCode.SharpZipLibは単語ごとに与えますが、その単語に関連付けられたスタイルを提供しません)。

これに関するヘルプは非常に役立ちます。

2 Answer


3


このMSDNの記事では、文書の正確なテキストを段落ごとに確実に取得する方法を示しています。

同時に、各段落のスタイルを決定できます。 それはとても簡単です。 次のブログ投稿は、各段落のスタイルとテキストを取得する方法を示しています。

2つを比較しますか? それは、あなたの希望する正確な意味に依存します。 1つの方法は、段落とスタイルを含むXMLドキュメントを作成し、XMLドキュメントを比較することです。 XMLドキュメントは次のようになります。

    Normal
    This is the text of the paragraph.


    Heading1
    Overview of the Process


0


最も簡単な方法は、お気に入りのZIPライブラリを使用してDOCXファイルを解凍し、テキストファイルをファイルIOライブラリと比較することです。