我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

Ubuntu各种衍生版本
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#16

帖子 寺島聰子 » 2018-04-26 11:51

FirefoxでこのPDFをオープンしてコピーしても同じ内容になりますか?
Is it the same if I copy and paste this PDF with Firefox?
±© ɽʽʒʷ˂ʵʦʉʽȺǾᝩ୥ ̄ᜫްȪȲȗᬱᄻɥᤣ੻ȪǾɲʽʉ˂ʦʉʽɥઃ
Ȫȹdᤣ੻ȪȲᬱᄻɁɿʠʫʕʯ˂ɥ᚜ᇉȪɑȬǿ
̈²© ɽʽʒʷᴪʵʦʉʽȺǾᝩ୥ ̄ᜫްȪȲȗᬱᄻɥᤣ੻

(タイピングするとWhen typing)
コントロールボタンで、調整/設定したい項目を選択し
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#17

帖子 寺島聰子 » 2018-04-26 11:54

ɽʽʒʷᴪʵʦʉʽȺǾᝩ୥ ̄ᜫްȪȲȗᬱᄻɥᤣ੻

同じでした。It was the same.
头像
susbarbatus
帖子: 2966
注册时间: 2010-04-10 16:14
系统: Arch Linux

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#18

帖子 susbarbatus » 2018-04-26 13:42

役に立てないかもしれませんが、いろいろ試したいですね。

まず、mupdfをインストールしてコピーして見よう。Mupdfはevinceと違て、popplerエンジン使わないだから。
そして、poppler-dataもインストールしてほしい、必要なフォントがはいています。
沉迷将棋中……
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#19

帖子 寺島聰子 » 2018-04-26 15:06

mupdfをインストール
(synaptic:3248): GLib-CRITICAL **: g_child_watch_add_full: assertion 'pid > 0' failed
Selecting previously unselected package mupdf.
(Reading database ... 321308 files and directories currently installed.)
Preparing to unpack .../archives/mupdf_1.3-2_amd64.deb ...
Unpacking mupdf (1.3-2) ...
Processing triggers for mime-support (3.54ubuntu1.1) ...
Processing triggers for desktop-file-utils (0.22-1ubuntu1.1) ...
Processing triggers for man-db (2.6.7.1-1ubuntu1) ...
Setting up mupdf (1.3-2) ...
poppler-dataもインストールしてほしい、必要なフォントがはいています。
既にインストール済みでした。它已經被安裝。

m@m ~ $ mupdf '/home/m/Downloads/um_ja_RadiForceG22.pdf'
warning: not building glyph bbox table for font 'OPCCND+HiraginoKaku-W3-90msp-RK' with 7795 glyphs
warning: not building glyph bbox table for font 'OPCCNE+HiraginoMin-W3-90msp-RKS' with 7795 glyphs
warning: not building glyph bbox table for font 'MODAAP+�q���M�m�p�S5' with 7531 glyphs
warning: not building glyph bbox table for font 'MOAFPE+�q���M�m�p�S3' with 7723 glyphs
warning: not building glyph bbox table for font 'MOAHPJ+�q���M�m�p�S7' with 7463 glyphs
warning: not building glyph bbox table for font 'MOAFLF+�q���M�m������3' with 7548 glyphs
warning: non-embedded font using identity encoding: Ryumin-Light

コピー・アンド・ペーストすると
????????? ?????? ????????????
头像
susbarbatus
帖子: 2966
注册时间: 2010-04-10 16:14
系统: Arch Linux

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#20

帖子 susbarbatus » 2018-04-26 16:51

ちょとサーチをした。これはもしかしてそのPDFファイル自体の問題の可能性でもあります。
詳しくはここ: https://forums.adobe.com/thread/915012

確認として、添付されるPDFファイルもコピーして見ましょう。
この場合、同じもんだい出ないと思います。
附件
test.pdf
(118.52 KiB) 已下载 199 次
沉迷将棋中……
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#21

帖子 poloshiao » 2018-04-26 16:52

https://www.computerhope.com/issues/ch001768.htm
How to view a PDF file in Linux

https://itsfoss.com/edit-pdf-files-ubuntu-linux/
How To Edit PDF Files In Linux In The Easiest Way Possible

Try to find out the original explanatory document how to create the um_ja_RadiForceG22.pdf file if you still could not view this file correctly.
このファイルを正しく表示できない場合は、um_ja_RadiForceG22.pdfファイルの作成方法を元のイラストの文書で確認してください。
如果仍然无法正确查看此文件,请尝试查找原始說明文档如何创建um_ja_RadiForceG22.pdf文件。
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#22

帖子 寺島聰子 » 2018-04-27 14:36

きのうは体調不良のため、いっさい返事せず失礼しました、今からです
從昨天起,由於身體狀況不佳,我昨天沒有回复而被解僱
PDFファイル自体の問題の可能性
PDF文件本身的问题的可能性
参考ページより
If you go to File>Properties and go to the Fonts tab, what is the Identity listed for the fonts?
Identity?
m@m ~ $ mupdf '/home/m/Downloads/um_ja_RadiForceG22.pdf'
warning: not building glyph bbox table for font 'OPCCND+HiraginoKaku-W3-90msp-RK' with 7795 glyphs
warning: not building glyph bbox table for font 'OPCCNE+HiraginoMin-W3-90msp-RKS' with 7795 glyphs
warning: not building glyph bbox table for font 'MODAAP+�q���M�m�p�S5' with 7531 glyphs
warning: not building glyph bbox table for font 'MOAFPE+�q���M�m�p�S3' with 7723 glyphs
warning: not building glyph bbox table for font 'MOAHPJ+�q���M�m�p�S7' with 7463 glyphs
warning: not building glyph bbox table for font 'MOAFLF+�q���M�m������3' with 7548 glyphs
warning: non-embedded font using identity encoding: Ryumin-Light
著明に上に関連している。上面有很大關係。
添付されるPDFファイルもコピーして見ましょう。
この場合、同じもんだい出ないと思います。
同時復制所附的PDF文件。
在這種情況下,我認為它不會出現同樣的問題。
出ません。「不會出現同樣的問題」!!
これ以外のすべてのPDFファイルにおいて、この問題を未経験です。
對於所有其他PDF文件,我沒有經驗這個問題。
  • warning: non-embedded font using identity encoding: Ryumin-Light
をネット検索すると、日本語で丁寧に書いてあるサイトがありました。
http://yang.amp.i.kyoto-u.ac.jp/~yyama/ ... emb-j.html
附件
Screenshot-Properties-1.png
Screenshot-Properties.png
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#23

帖子 寺島聰子 » 2018-04-27 18:16

poloshiaoさん、ありがとうございます
poloshiao先生,謝謝。
https://www.computerhope.com/issues/ch001768.htm
より引用
Depending on your needs, we recommend LibreOffice if you need to edit a PDF and Evince if you just need to view a PDF.
Installing LibreOffice
Debian and Ubuntu

代码: 全选

sudo apt-get update && sudo apt-get install libreoffice
わたしはLibreOffice Writerと必須コンポーネントのみをインストール希望なのですが、どうすれば?
我想只安裝LibreOffice Writer和基本組件,但是如何?
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#24

帖子 寺島聰子 » 2018-04-27 18:53

https://www.libreofficechina.org/uc_ser ... _small.jpg

It is possible. When you run the installer you have to pick the Custom Install option.
Please note that there is a fair bit of the suite that will still be installed as some of the components are required whether you have one part (in your case Writer) installed or the entire suite.
I did a comparison a while back regarding the amount of space required on a component by component basis, with a comparison to the entire suite. While I can't find my notes at this point, it seems to me that even installing just one component still required about 75% of the space required for the entire suite.

これを信じて Believe in this

代码: 全选

libreoffice-core (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-base-core (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-base-drivers (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-base (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-calc (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-draw (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-impress (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-math (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-report-builder-bin (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-writer (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-avmedia-backend-gstreamer (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice-java-common (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
python3-uno (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
libreoffice (1:4.4.3~rc2-0ubuntu1~trusty1) を設定しています ...
menu (2.1.46ubuntu1) のトリガを処理しています ...
m@m ~ $ 
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#25

帖子 寺島聰子 » 2018-04-27 19:51

um_ja_RadiForceG22.pdf fileをLibreOffice Writer で開くと

F��:�#ŵڸ��##p��#�FŠ#�%�� �#W���م#k��<a(��69#�\#`\N�j#�$#e+��#�9#�~�W�1f�##w��ȑ
�OS���

------------------------------------------------
请尝试查找原始說明文档如何创建um_ja_RadiForceG22.pdf文件
見当つかないがグーグル検索で探してみる
I have no idea but try searching by google search
ありがとうございます谢谢
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#26

帖子 poloshiao » 2018-04-27 20:04

um_ja_RadiForceG22.pdf fileをLibreOffice Writer で開くと
https://superuser.com/a/1259781
there are third-party applications and web services that will convert the PDF to ODT, which you can then open in Writer
1. Online2PDF, CloudConvert, Zamzar, and file-converter-online all convert to and from PDF for a range of formats, including ODT.

2. Convertio also includes the ability to run OCR on a PDF image file to recover the document and formatting.

3. Sejda and Smallpdf don't convert to ODT, but they can convert to MS Office formats, which LibreOffice can open and use.

Notice :
The above methods could not guarantee itself as a successful way to view the um_ja_RadiForceG22.pdf content.
上述方法无法保证自己成为查看 um_ja_RadiForceG22.pdf 内容的成功方法。
上記の方法では、um_ja_RadiForceG22.pdfの内容を確認するうまくいっているとは限りません。
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#27

帖子 寺島聰子 » 2018-04-27 20:32

1. Online2PDF,略 and file-converter-online all convert to and from PDF for a range of formats, including ODT.
https://online2pdf.com/
上述方法无法保证自己成为查看 um_ja_RadiForceG22.pdf 内容的成功方法。
失敗。表示がメチャクチャ。
Failure. It displays the mess.

7. ɺʳʟɭʍɹʃɵ˂ʓɁሗҝɥᜫްȪɑȬǿ қఙᜫްȺɂȈʬʘɹʷȉɁȈ¸âéôȉᴥ¸âéô ߦख़Ɂʬʘɹʷɺʳʟɭʍɹʃɵ˂ ʓᴦȾᜫްȨɟȹȗɑȬǿȝΈȗɁɽʽʞʯ˂ʉȾ ±°âéô ߦख़Ɂʬʘɹʷɺʳʟ

しかし、すばらしい有用なサイトを紹介して下さりありがとうございました!
但是,感謝您介紹一個美妙而有用的網站! :em02
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#28

帖子 寺島聰子 » 2018-04-27 20:46

原始說明文档如何创建um_ja_RadiForceG22.pdf文件
とは プロパティ>ジェネラルに表示されている
And is displayed in Property> General
producer Acrobat Distiller 6.0 (Windows)
Creator Adobe Acrobat 6.0
のことでしょうか?
附件
Screenshot-Properties.png
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#29

帖子 poloshiao » 2018-04-27 21:29

producer Acrobat Distiller 6.0 (Windows)
Creator Adobe Acrobat 6.0
1. https://metacpan.org/release/PDF-FDF-Simple
PDF::FDF::Simple - Read and write (Acrobat) FDF files.

2. https://packages.ubuntu.com/search?suit ... chon=names
Package libpdf-fdf-simple-perl
Perl module to read and write (Acrobat) FDF files
2-1. sudo apt install libpdf-fdf-simple-perl

3. https://askubuntu.com/questions/767937/ ... -04/851704
How do I install Adobe Acrobat in Ubuntu 16.04?
头像
susbarbatus
帖子: 2966
注册时间: 2010-04-10 16:14
系统: Arch Linux

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#30

帖子 susbarbatus » 2018-04-28 11:30

やはりこのPDFファイル自体が壊れてるか故意にコピー出来ないようにされましたね。
その場合、通常の方法で文字をコピーすることが不可能ですよね。
ならば、PDFファイルからより、単なるイメージから文字を取り出す方法が妥当と思います。

私が使ったことないけど、このソフトが考えられます:
https://code.google.com/archive/p/nhocr/
沉迷将棋中……
回复