Extraia Texto e Tabelas de Arquivos PDF
Extraia texto limpo e dados de tabelas estruturadas de qualquer PDF. Perfeito para pipelines de dados, indexação de busca, análise de conteúdo e alimentação de modelos de IA/LLM.
# JSON with tables — /v2/pdf/extract-text (recommended)
curl -X POST \
https://api.convertfilefast.com/v2/pdf/extract-text \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@report.pdf" \
-F "pages=1-5" \
-F "extract_tables=true"
# Plain text file — /v2/convert/pdf-to-txt
curl -X POST \
https://api.convertfilefast.com/v2/convert/pdf-to-txt \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@report.pdf" \
--output extracted.txtVantagens
Por que usar nossa API?
Solução completa e confiável para integração em qualquer stack tecnológico.
Extração de Texto
Extraia texto limpo e estruturado de qualquer PDF com detecção adequada de parágrafos.
Detecção de Tabelas
Detecta e extrai automaticamente tabelas como arrays de dados estruturados para processamento.
Seleção de Páginas
Extraia de páginas específicas (ex: "1,3,5-7") ou de todas as páginas em uma requisição.
Acesso a Metadados
Obtenha metadados do PDF (título, autor, data de criação) junto com o texto extraído.
Pronto para IA/LLM
Perfeito para alimentar conteúdo extraído para ChatGPT, Claude ou pipelines de IA customizados.
Integração com Pipelines
Integre facilmente em pipelines ETL com n8n, Airflow ou scripts de processamento customizados.
Comece a Extrair Texto de PDFs
Obtenha sua chave de API e extraia texto de documentos PDF em segundos. Plano gratuito inclui 10 conversões por mês.
Sem cartão de crédito. 10 conversões grátis no plano Free.