Projects/DIY Book Scanner

From Prishtina Hackerspace
Jump to: navigation, search

"Active" is not recognized as a Boolean (true/false) value.

Prishtina Hackerspace Project
Skeneri i librave bonevet
Skeneri.jpg
Status:Active
Start Date:01.10.2015
End Date:
Project leader:Bresta


Skeneri i librave bonevet

Skeneri asht nji pajisje që përdorët me i dixhitalizu faqet e nji libri, asht ndërtu duke u bazu në punën e krijume prej komunitetit. Kamerat përdorën me i kap imazhet e çdo faqe. Ku mandej përpunohen dhe kthehen në *.txt dhe .epub. Skanerin e kemi ndërtu duke u bazu në planet dhe udhëzimet e Archvist. Dy kamera Canon PowerShot A2500 (me CHDK firmware) kontrollohen nga programi Spreads i cili vjen i instalum në PiScan që jemi tu e përdor. Masi të kryhet skanimi, imazhet përpunohen me Scan Tailor. Dhe në fund duke ba njohje optike të karakterave me Tesseract OCR i cili ka mbështetje edhe për gjuhën shqipe imazhet kthehën në tekst dhe formate tjera.

Përshkrimi i procesit të skenimit

  • Dheze Raspberry Pi
  1. Shtyp Next (1) për me fillu punën,
  2. Vendose librin në vendin e vet edhe dhezi dritat,
  3. Shtyp Next (1) për me vazhdu pasi që e ka njoft USB drive,
  4. Tash i dhez kamerat edhe Shtyp Next (1) me vazhdu,
  5. Në ket pjesë, mundesh me e ndryshu zoom-in edhe shpejtsinë e kamerave,
  6. Masi që janë fokusu kamerat, Shtyp Next (1) për me vazhdu,
  7. Tash shtyp Space për me i skanu faqet, dy ka dy! :)
  • Masi e kryn skenimin e librit e merr USB drive edhe i transferon imazhet në kompjuterin tand (Linux) me nji follder të ri. Mandej e instalon Scan Tailor për përpunimin e imazheve, mundesh me kqyr ket video e cila të mëson qysh me perdor Scan Tailor në detaje. Scan Tailor e kthen outputin në TIF fajlla, ato fajlla duhet me i kthy në nji fajll të vetem TIF për me pas ma leht gjenerimin e karakterave me OCR, për ket proces jemi tu e perdor gscan2pdf dhe imagemagick.
  • Për njohje optike të karakterave jemi tu perdor Tesseract OCR edhe mundesh shumë leht me i kthy TIF fajlla në tekst me nji komandë në terminal: tesseract libri.tif libri.txt -l sqi