GetText
GetText()
Извлекает текст из документа.
public TextReader GetText()
Возвращаемое значение
ЭкземплярTextReader класс с извлеченным текстом; нулевой
если извлечение текста не поддерживается.
Примечания
Узнать больше:
Примеры
В следующем примере показано, как извлечь текст из документа:
// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
// Извлечь текст в ридер
using(TextReader reader = parser.GetText())
{
// Печатаем текст из документа
// Если извлечение текста не поддерживается, читатель имеет значение null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
Смотрите также
- class Parser
- пространство имен GroupDocs.Parser
- сборка GroupDocs.Parser
GetText(TextOptions)
Извлекает текстовую страницу из документа с помощью параметров текста (чтобы включить режим быстрого извлечения необработанного текста).
public TextReader GetText(TextOptions options)
Параметр | Тип | Описание |
---|---|---|
options | TextOptions | Параметры извлечения текста. |
Возвращаемое значение
ЭкземплярTextReader класс с извлеченным текстом; нулевой
если извлечение текста не поддерживается.
Примечания
Узнать больше:
Примеры
В следующем примере показано, как извлечь необработанный текст из документа:
// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
// Извлечь необработанный текст в ридер
using(TextReader reader = parser.GetText(new TextOptions(true)))
{
// Печатаем текст из документа
// Если извлечение текста не поддерживается, читатель имеет значение null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
Смотрите также
- class TextOptions
- class Parser
- пространство имен GroupDocs.Parser
- сборка GroupDocs.Parser
GetText(int)
Извлекает текст со страницы документа.
public TextReader GetText(int pageIndex)
Параметр | Тип | Описание |
---|---|---|
pageIndex | Int32 | Индекс страницы с отсчетом от нуля. |
Возвращаемое значение
ЭкземплярTextReader класс с извлеченным текстом; нулевой
если извлечение текстовой страницы не поддерживается.
Примечания
Узнать больше:
Примеры
В следующем примере показано, как извлечь текст со страницы документа:
// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
// Проверяем, поддерживает ли документ извлечение текста
if(!parser.Features.Text)
{
Console.WriteLine("Document isn't supports text extraction.");
return;
}
// Получить информацию о документе
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// Проверяем, есть ли в документе страницы
if(documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Перебираем страницы
for(int p = 0; p<documentInfo.PageCount; p++)
{
// Печатаем номер страницы
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
// Извлечь текст в ридер
using(TextReader reader = parser.GetText(p))
{
// Печатаем текст из документа
// Мы игнорируем проверку на null, так как мы проверили поддержку функции извлечения текста ранее
Console.WriteLine(reader.ReadToEnd());
}
}
}
Смотрите также
- class Parser
- пространство имен GroupDocs.Parser
- сборка GroupDocs.Parser
GetText(int, TextOptions)
Извлекает текст со страницы документа с помощью параметров текста (чтобы включить режим быстрого извлечения необработанного текста).
public TextReader GetText(int pageIndex, TextOptions options)
Параметр | Тип | Описание |
---|---|---|
pageIndex | Int32 | Индекс страницы с отсчетом от нуля. |
options | TextOptions | Параметры извлечения текста. |
Возвращаемое значение
ЭкземплярTextReader класс с извлеченным текстом; нулевой
если извлечение текстовой страницы не поддерживается.
Примечания
Узнать больше:
Примеры
В следующем примере показано, как извлечь необработанный текст со страницы документа:
// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
// Проверяем, поддерживает ли документ извлечение текста
if(!parser.Features.Text)
{
Console.WriteLine("Document isn't supports text extraction.");
return;
}
// Получить информацию о документе
DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
// Проверяем, есть ли в документе страницы
if(documentInfo == null || documentInfo.RawPageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Перебираем страницы
for(int p = 0; p<documentInfo.RawPageCount; p++)
{
// Печатаем номер страницы
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
// Извлечь текст в ридер
using(TextReader reader = parser.GetText(p, new TextOptions(true)))
{
// Печатаем текст из документа
// Мы игнорируем проверку на null, так как мы проверили поддержку функции извлечения текста ранее
Console.WriteLine(reader.ReadToEnd());
}
}
}
Смотрите также
- class TextOptions
- class Parser
- пространство имен GroupDocs.Parser
- сборка GroupDocs.Parser