使用 PHP 讀取 PDF 文件

建立專案

建立專案。

1
2
mkdir php-pdf-reader
cd php-pdf-reader

安裝套件

安裝套件。

1
composer require smalot/pdfparser:2.7

修改 composer.json 檔。

1
2
3
4
5
6
7
8
9
10
{
"autoload": {
"psr-4": {
"App\\": "app/"
}
},
"require": {
"smalot/pdfparser": "^2.7"
}
}

實作

建立 app/PdfParser.php 檔。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
<?php

namespace App\Helpers;

use Smalot\PdfParser\Parser;

class PdfParser
{
private $parser;

private $document;

public function __construct($filename)
{
$this->parser = new Parser();
$this->document = $this->parser->parseFile($filename);
}

public function getText()
{
$text = $this->document->getText();

return $text;
}
}

使用

新增 index.php 檔。

1
2
3
4
5
6
7
8
9
10
<?php

require __DIR__.'/vendor/autoload.php';

use App\PdfParser;

$parser = new PdfParser('./example.pdf');
$text = $parser->getText();

print_r($text);

執行。

1
php index.php

程式碼