GetText

GetText()

Извлекает текст из документа.

public TextReader GetText()

Возвращаемое значение

ЭкземплярTextReader класс с извлеченным текстом; нулевой если извлечение текста не поддерживается.

Примечания

Узнать больше:

Примеры

В следующем примере показано, как извлечь текст из документа:

// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
    // Извлечь текст в ридер
    using(TextReader reader = parser.GetText())
    {
        // Печатаем текст из документа
        // Если извлечение текста не поддерживается, читатель имеет значение null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Смотрите также


GetText(TextOptions)

Извлекает текстовую страницу из документа с помощью параметров текста (чтобы включить режим быстрого извлечения необработанного текста).

public TextReader GetText(TextOptions options)
Параметр Тип Описание
options TextOptions Параметры извлечения текста.

Возвращаемое значение

ЭкземплярTextReader класс с извлеченным текстом; нулевой если извлечение текста не поддерживается.

Примечания

Узнать больше:

Примеры

В следующем примере показано, как извлечь необработанный текст из документа:

// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
    // Извлечь необработанный текст в ридер
    using(TextReader reader = parser.GetText(new TextOptions(true)))
    {
        // Печатаем текст из документа
        // Если извлечение текста не поддерживается, читатель имеет значение null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Смотрите также


GetText(int)

Извлекает текст со страницы документа.

public TextReader GetText(int pageIndex)
Параметр Тип Описание
pageIndex Int32 Индекс страницы с отсчетом от нуля.

Возвращаемое значение

ЭкземплярTextReader класс с извлеченным текстом; нулевой если извлечение текстовой страницы не поддерживается.

Примечания

Узнать больше:

Примеры

В следующем примере показано, как извлечь текст со страницы документа:

// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
    // Проверяем, поддерживает ли документ извлечение текста
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // Получить информацию о документе
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Проверяем, есть ли в документе страницы
    if(documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Перебираем страницы
    for(int p = 0; p<documentInfo.PageCount; p++)
    {
        // Печатаем номер страницы 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
 
        // Извлечь текст в ридер
        using(TextReader reader = parser.GetText(p))
        {
            // Печатаем текст из документа
            // Мы игнорируем проверку на null, так как мы проверили поддержку функции извлечения текста ранее
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Смотрите также


GetText(int, TextOptions)

Извлекает текст со страницы документа с помощью параметров текста (чтобы включить режим быстрого извлечения необработанного текста).

public TextReader GetText(int pageIndex, TextOptions options)
Параметр Тип Описание
pageIndex Int32 Индекс страницы с отсчетом от нуля.
options TextOptions Параметры извлечения текста.

Возвращаемое значение

ЭкземплярTextReader класс с извлеченным текстом; нулевой если извлечение текстовой страницы не поддерживается.

Примечания

Узнать больше:

Примеры

В следующем примере показано, как извлечь необработанный текст со страницы документа:

// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
    // Проверяем, поддерживает ли документ извлечение текста
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // Получить информацию о документе
    DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
    // Проверяем, есть ли в документе страницы
    if(documentInfo == null || documentInfo.RawPageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Перебираем страницы
    for(int p = 0; p<documentInfo.RawPageCount; p++)
    {
        // Печатаем номер страницы 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
 
        // Извлечь текст в ридер
        using(TextReader reader = parser.GetText(p, new TextOptions(true)))
        {
            // Печатаем текст из документа
            // Мы игнорируем проверку на null, так как мы проверили поддержку функции извлечения текста ранее
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Смотрите также