반응형
PDF 문서에서 텍스트를 추출하는 방법은 무엇입니까?
PHP를 사용하여 PDF 문서에서 텍스트를 추출하는 방법은 무엇입니까?
(다른 도구를 사용할 수 없습니다. 루트 액세스 권한이 없습니다.)
일반 텍스트에 대해 작동하는 일부 기능을 찾았지만 유니코드 문자를 잘 처리하지 못합니다.
http://www.hashbangcode.com/blog/zend-lucene-and-pdf-documents-part-2-pdf-data-extraction-437.html
class.pdf2text를 다운로드합니다.php @ https://pastebin.com/dvwySU1a 또는 https://webcheatsheet.com/php/scripts/pdf2text.zip
코드:
include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('filename.pdf');
$a->decodePDF();
echo $a->output();
언급URL : https://stackoverflow.com/questions/6999889/how-to-extract-text-from-the-pdf-document
반응형
'prosource' 카테고리의 다른 글
html 텍스트를 텍스트 뷰에 html 텍스트 표시 (0) | 2023.09.05 |
---|---|
자바스크립트에서 상수 객체를 변경할 수 있는 이유는 무엇입니까? (0) | 2023.09.05 |
배열에서 다른 배열에 없는 요소를 찾기 위한 Javascript 알고리즘 (0) | 2023.09.05 |
jQuery의 document.ready 함수는 언제 사용해야 합니까? (0) | 2023.09.05 |
R에 있는 그림의 첨자 (0) | 2023.09.05 |