Quantcast
Channel: pdf – Gea-Suan Lin's BLOG
Browsing all 17 articles
Browse latest View live

Adobe Reader X 的 Sandbox…

Adobe Reader X (也就是 10) 相較於之前的版本,引入了 Sandbox 的架構。安全性比起之前的版本好很多。 在 Slashdot 就有提到 Adobe Reader X 釋出以後,對最近的一些惡意 PDF 的抗性高出不少:「Adobe’s Reader X Spoils New PDF Attack」。 另外對於安裝 Adobe Reader X 時需要安裝 DLM...

View Article



Image may be NSFW.
Clik here to view.

在 Ubuntu 的 Chrome (Chromium) 看 PDF 的方式

由於 PDF Viewer 不是 free software (參考「Why doesn’t Chromium have “Chrome PDF Viewer” plugin?」),所以 Ubuntu 下的 Chromium 並沒有包進去,需要自己手動安裝。 方法可以參考「Chrome PDF Plugin in Ubuntu – How To Enable」這篇: 先依照平台決定要抓...

View Article

Image may be NSFW.
Clik here to view.

推薦《An Introduction to Programming in Go》這本書…

書的資料: An Introduction to Programming in Go. Copyright © 2012 by Caleb Doxsey ISBN: 978-1478355823 以及網站:「An Introduction to Programming in Go」。有平裝實體書版本,也有電子 Kindle 版,網站上有 PDF 可以下載,或是直接 HTML 觀看。我是看完...

View Article

OWASP’s Top 10,2013 版

在 Slashdot 上看到 OWASP 給出 2013 年的網站安全威脅 Top 10 名單:「OWASP Top 10 2013 Released」。 一如往常,Slashdot 的第一個 comment 還是很經典 XDDD The offered list of vulnerabilities is in a pdf. 這… XD 在 Wiki 上有一份非 PDF...

View Article

Chromium 的 PDFium

PDFium 是 open source PDF rendering engine,功能上像是 Mozilla 所研發的 PDF.js,不過是以 C++ 寫的原生套件。 看起來目標是要進 Chrome 與 Chromium,以取代現有 Google Chrome 裡所含的非 open source 版本。 不過 Chromium 目前應該已經有 PDF Viewer 可以用?(利用 PDF.js...

View Article


Image may be NSFW.
Clik here to view.

推薦《Build APIs You Won't Hate》這本書

7/26 就買了,算一算到現在也快四個禮拜,剛剛總算是讀完了,所以可以跟大家推薦《Build APIs You Won't Hate》這本書。 作者 Phil Sturgeon 是 PHP 的資深開發者,同時也是 PHP-FIG 的投票成員。 這本書講了很多 API 設計時會遇到的問題。作者不是直接講「用什麼方法是對的」,而是提出每一種方法的缺點,然後再下結論。...

View Article

Image may be NSFW.
Clik here to view.

JPEG 用 AES-CBC 加密後變成 PNG,用 3DES-CBC 解密後變成 PDF...

直接練出一份 PoC 讓大家看:「a JPEG that becomes a PNG after AES encryption and a PDF after 3DES decryption」,這是原始檔:(這邊直接引用 Google Code 上的 image) 透過 AES-CBC 加密後會是這樣的圖片: 透過 3DES-CBC 解密後則是這樣的 PDF: Related Posts:...

View Article

DEF CON 22 的投影片以及影片釋出

DEF CON 22 在八月結束後,投影片與影片都放出來了,可以在「Index of /DEF CON 22」這邊取得。 影片的部份居然還附上 srt 檔,而 presentation 裡面還有一堆 PDF,到底能不能開啊... XD

View Article


一次下載論文所有的 Reference PDF

感覺就是個做研究的人會很愛的東西:「PDFx - Extract metadata and URLs from PDFs, and download all referenced PDFs」。 程式會試著抓出 PDF 裡的 reference,並且試著找出網路上的 PDF 連結並下載。對於該開始進入做研究時,背景知識可能不足以閱讀這篇論文,會需要從研究被引用的論文開始看,這個程式就派上用場了......

View Article


Springer 免費提供的數學書 (PDF)

在 Hacker News Daily 上看到有人在 Gist 上把 Springer 提供的數學類 PDF 書籍整理出來 (Direct links to free Springer maths books (pdf versions)),查了一下好像是「Springer launches full book download feature」的一環?: Springer have made a...

View Article

Image may be NSFW.
Clik here to view.

另外一篇講文件掃描的...

在「Page dewarping」這篇看到講文件掃描的技術,以及 open source 的程式,對比之前提到的「Dropbox 的文件掃描功能」與「Dropbox 的 Document Detecting」的時間點,有種淡淡的惡意 XD 這篇作者是為了未婚妻的需求而寫出來的,本來是作者收到學生的作業時手動在跑,後來未婚妻也拿去用,但量愈來愈大,決定自動化處理: A while back, I...

View Article

Google 與 CWI Amsterdam 合作,找到 SHA-1 第一個 collision

Google 與 CWI Amsterdam 正式攻陷 SHA-1:「Announcing the first SHA1 collision」,然後也沒什麼意外的,現在大家都喜歡針對各種安全問題註冊一個 domain 來介紹:「SHAttered」。 把 shattered-1.pdf 與 shattered-2.pdf 下載下來確認,可以看出來兩個不一樣的檔案有同樣的 SHA-1 value:...

View Article

在 Kindle 上讓 PDF 變得更容易看的工具

在這邊看到 K2pdfopt 這個工具: 通过 Google 找到了这个开源的 PDF 重排版工具 K2pdfopt https://t.co/Bw1oVOnMyW ,即使多列内容或者含大量数学公式,重排后在 Kindle 阅读效果也很好。虽然重排后可能导致文件增大,但阅读更流畅了(减轻了 Kindle 的处理负担)。 https://t.co/Sgj8X4NfQc — handongxue...

View Article


在網頁上看 arXiv 的論文

Hacker News Daily 上看到的服務「Arxiv Vanity – Read academic papers from Arxiv as web pages」: Arxiv Vanity renders academic papers from Arxiv as responsive web pages so you don’t have to squint at a PDF....

View Article

全自動化「印出來,簽名,掃描再寄回去」的事情

看到「falsisign」這個專案 (FalsiScan: Make it look like a PDF has been hand signed and scanned),完全符合這個 blog 的副標題「幹壞事是進步最大的原動力」的精神,不介紹一下好像說不過去...: For bureaucratic reasons, a colleague of mine had to print,...

View Article


HTML 轉 SVG

在「html-to-svg」這邊看到的,專案在 GitHub 上的「as-a-service/html-to-svg」這邊。 整個服務的程式碼其實很短 (大約 50 行?),因為主要的業務是透過 Chrome (headless) 生出 PDF 檔,再用 Inkspace 把 PDF 轉成 SVG:「htmltosvg.js」。 主要是 Inkspace 可以做 PDF 轉 SVG...

View Article

Image may be NSFW.
Clik here to view.

抓 PDF 裡文字的問題

在 Hacker News Daily 上看到的,在講從 PDF 裡面拉文字出來遇到的各種問題:「What's so hard about PDF text extraction?」。 FilingDB 是一家處理歐洲公司資料的公司,可能是開公司時送件的時候要求用 PDF,或是政府單位輸出的時候用 PDF,所以他們必須從這些 PDF 裡面拉出文字分析,然後就能夠讓程式使用: 會這麼難搞的原因是因為...

View Article

Browsing all 17 articles
Browse latest View live


Latest Images