Versionsproblem bei PDF auslesen mit extractFileText().

1 view (last 30 days)
Hallo,
ich habe ein Skript das PDF-Files ausliest und den gelesenen Text in einem String speichert und dann weiterverarbeitet. Um die PDF auszulesen wurde extractFileText genutzt. Der Code wurde damals mit Version 2018 geschrieben und der Code läuft nicht mehr richtig auf 2022b . Das Problem ist in der PDF sind Texte/Wörte vertikal geschrieben. Mit Version 2018 erkennt die Funktion den ganzen Text egal wie er ausgerichtet ist und in Version 2022b erkennt die Funktion nur noch horizontal ausgerichteten Text. Gibt es eine Möglichkeit wie ich den Code wieder zum laufen bringen kann oder muss ich den Code mit Version 2018 laufen lassen?

Answers (1)

Andreas Goser
Andreas Goser on 20 Sep 2023
Es ist möglich, dass es sich um einen Bug handelt. Daher bitte das Verhalten im aktuellen Release R2023b testen, vielleicht ist es ja gefixt. Falls nicht, bitte mit einem reproduzierbaren Beispiel den Technischen Support kontaktieren.

Products


Release

R2022b

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!