Discussion about this post

User's avatar
Lars Schotte's avatar

Ale ešte jedna vec k tomu artiklu teraz:

`We use Enterprise API tiers (Google Vertex AI, OpenAI Enterprise, Mistral Platform). Provider contracts explicitly prohibit training on customer data. Documents are retained only for the processing window before being discarded.`

Sa nedá brať vážne, lebo celá AI bublina je jedna banda podvodníkov a tí budú aj tak skrachovaní keď praskne, čiže to, čo sa s nimi dohodne je null-and-void aj tak.

`Strict Schemas: Pydantic enforces structural correctness and type safety, preventing entire classes of errors where extracted values land in incompatible fields (for example, text appearing in numeric tax fields). While schema validation cannot guarantee semantic correctness on its own, it acts as a critical guardrail—ensuring that only structurally valid data enters downstream business logic and repair workflows.`

Bu Bu Bu ... na to nepotrebujem ani riešiť nič v appke, stačí, že mám tieto typy dobre zadané v SQL databanke, do ktorej to potom dávam. Tam by mi to buchlo tiež, keď by dával varchar do integera a podobne, takisto sa dajú aj v SQL spraviť CHECK bullshit-protectory.

`Cost Transparency: Every extraction includes a full cost_breakdown for audit and chargeback.`

Áno? Ja by som povedal, že to je radar na exekútorského úradníka, ktorý bude všetky AI firmy naháňať pre tie sekery, ktoré voči investorom zanechali.

Lars Schotte's avatar

S týmto by sa mi ľahko prišlo aj samému, lebo niečo podobné som aj ja robil, ale nie s faktúrami.

Flat scanner sa dá ľahko s `while true`; do sleep 10; scan_that_thing; done prehovoriť k tomu, aby spustil `scanimage`a výsledok pipe-ol do tesseractu, ktorý vyextrahuje text, ktorý potom cez pipe hodím rovno do grep -oE 'spolu na úhradu [^€]+ €' vybavené. A nemusím nič programovať.

Ja som ale scanoval "právne" dokumenty, tak som to po tesseracte ešte nehal prehnať do hunspell, lebo tam už vychytá niektoré zle rozpoznané symboly na kontrole pravopisu.

Ak je na faktúre PayBySquare, tak sa dá jednoducho cez ImageMagick crop filtrom odrezať cirka len miesto, kde sa nachádza ten QR code, ktorý nás zaujíma, aby sme nezobrali nejaký vedľa, a potom ten výstup (napr PNG, alebo TIFF) trepneme rovno do zbar a ten ti potom vyklepne ten JSON, čo fakticky PayBySquare je, špecifikácia je na githube, cez ten ich python modul vidíme ako sa to skladá a tento JSON potom môžem rovno prevziať do systému, tie položky, ktoré treba (ako IBAN a sumu atď).

Ono toto nie je nič nové. SAP má nejaký modul, kde im človek na jeden mail posiela faktúry ako invoice@example.com a potom ten to číta cez IMAP, vyťahuje z toho PDF a té hádže rovno do pdftotext, aby mal text a tam potom sa pokračuje cez grep, čo má výhodu, že tam nemáme nepresnosti OCRka. Ale aj tak je to na hovno, keď tam príde nejaký rozbitý PDF, tak to je potom tiež nespoľahlivé a preto si vymysleli ten eInvoicing, čo oni za to lobbovali, aby sa to dalo do EU-lex, aby to museli všetci posielať cez XML a tým pádom celý takýto byznis model padá.

XML si každý už parsne ako DOM a potom tam môže lietať cez findElement, ako pri HTML.

Čo tým ale chcem povedať je, že žiadne AI netreba a to je vyhodená energia a penáze (hlavne).

Ja som nad takým rozmýšlal už dávno a to sú tie dôvody prečo som do toho nešiel už 10 rokov dozadu, lebo tie problémy zostali tie isté a akonáhle sa invoicuje cez XML padá všetko (2027).

No posts

Ready for more?