
Kiindulási helyzet
Egy középvállalati ügyfél több mint 2,5 millió dokumentumot tárolt különböző hálózati megosztásokon és fájlszervereken. A dokumentumok között szerepeltek:
- szerződések,
- számlák,
- műszaki dokumentációk,
- HR-anyagok,
- beszkennelt papíralapú iratok,
- e-mail mellékletek,
- vegyes formátumú PDF-ek és képfájlok.
A dokumentumállomány az évek során rendezetlenné vált:
- eltérő mappastruktúrák alakultak ki,
- hiányos vagy hibás fájlnevek voltak használatban,
- a beszkennelt dokumentumok nem voltak kereshetők,
- nem létezett egységes metaadat-kezelés,
- az üzleti folyamatok lassúvá és auditálhatatlanná váltak.
A vállalat célja egy központi, intelligens dokumentumtár kialakítása volt az Alfresco Content Services platformon, automatizált feldolgozással és AI-alapú dokumentumosztályozással.
A megoldás
A projekt során az ügyfél a BroadBit csapata által fejlesztett és testreszabott AutoMeta és collAIgue rendszerek használtuk.
A két rendszer együttműködésével teljesen automatizált dokumentummigrációs és intelligens tartalom-feldolgozási folyamat valósult meg.
Projektcélok
A migrációs projekt fő céljai:
- Több millió dokumentum automatizált, emberi beavatkozás nélküli migrációja
- OCR-alapú szövegkinyerés
- AI-alapú dokumentum-osztályozás
- Strukturált metaadat-kinyerés
- Egységes vállalati dokumentumtár kialakítása
- Gyors kereshetőség és auditálhatóság biztosítása
Architektúra áttekintés
Az architektúra az alábbi fő komponensekből állt:

Migrációs folyamat részletesen
1. Dokumentumok feltérképezése
A projekt első fázisában a rendszer automatikusan feltérképezte a meglévő hálózati megosztásokat.
Az AutoMeta:
- elemezte a könyvtárstruktúrát,
- azonosította a fájltípusokat,
- kiszűrte a duplikátumokat,
- statisztikát készített a dokumentumállományról.
Az előzetes elemzés során kiderült, hogy:
- a dokumentumok 70%-a beszkennelt PDF volt (OCR nélkül),
- közel 10% duplikált állomány létezett,
- több mint 50 különböző dokumentumtípus fordult elő.
2. OCR feldolgozás
A migráció egyik legfontosabb eleme az OCR-feldolgozás volt.
A rendszer:
- automatikusan felismerte a szkennelt dokumentumokat,
- többnyelvű OCR-feldolgozást végzett,
- strukturált szöveget állított elő (text layer),
- kereshető PDF-eket generált.
Az OCR eredményeként:
- a korábban nem kereshető dokumentumok teljes szöveges kereséssel elérhetővé váltak,
- az Alfresco-ba betöltött dokumentumokat elkezdhették használni az ügyintézők,
- lehetővé vált az AI-alapú osztályozás.
AI-alapú klasszifikáció collAIgue segítségével
A collAIgue rendszer nagy nyelvi modellek segítségével automatikusan elemezte a dokumentumok tartalmát.
A rendszer képes volt felismerni például:
- számlákat,
- szerződéseket,
- teljesítésigazolásokat,
- HR-dokumentumokat,
- ügyféllevelezéseket,
- műszaki specifikációkat.
Entitásfelismerés
A collAIgue az alábbi adatokat is automatikusan kinyerte:
- ügyfélnév,
- szerződésszám,
- dátumok,
- partnerazonosítók,
- adószámok,
- dokumentum azonosítók,
- kapcsolódó azonosítók,
- dokumentumtípus
- van-e aláírás a dokumentumon.
Metaadat-struktúra kialakítása
Az AutoMeta a klasszifikáció eredménye alapján szabványos metaadat-struktúrát hozott létre az Alfresco-ban.
Példa:
| Dokumentum | Kinyert metaadatok |
|---|---|
| Számla | partner, dátum, számlaszám, összeg |
| Szerződés | ügyfél, szerződésszám, hatályosság, aláírások |
| HR dokumentum | munkavállaló neve, osztály, hatályosság, aláírások |
| Műszaki dokumentáció | projektkód, verzió |
Automatikus mappastruktúra
Az egyik legnagyobb üzleti értéket az automatikusan kialakított rendezett dokumentumtár jelentette.
A rendszer a metaadatok alapján automatikusan hozta létre a célmappákat az Alfresco Content Services repository-ban.
A dokumentumok:
- automatikusan a megfelelő helyre kerültek,
- egységes elnevezést kaptak,
- teljes metaadatkészlettel kerültek tárolásra.
Integráció az Alfresco rendszerrel
Az integráció REST API-kon és repository szolgáltatásokon keresztül valósult meg.
A migráció során az AutoMeta:
- létrehozta a szükséges mappa-struktúrákat,
- feltöltötte a dokumentumokat,
- hozzárendelte a metaadatokat,
- jogosultságokat kezelt.
Az eredmény egy teljesen strukturált, vállalati szintű dokumentumtár lett.
Teljesítmény és skálázhatóság
A projekt során kiemelt szempont volt a nagy tömegű dokumentumok feldolgozása.
Feldolgozási mutatók
| Mutató | Érték |
|---|---|
| Migrált dokumentumok száma | 2,5 millió+ |
| OCR feldolgozás | 950 000+ dokumentum |
| AI klasszifikáció pontossága | 95–98% |
| AI metaadat-kinyerés pontosság | 90-92% |
| Duplikáció-csökkentés | ~15% |
Üzleti eredmények
A projekt eredményeként:
Jelentősen gyorsult a dokumentumkezelés
A dokumentumok keresési ideje percekről másodpercekre csökkent.
Megszűnt a manuális szortírozás
Korábban több munkatárs napi szinten manuálisan rendezte az állományokat.
Auditálható működés jött létre
Minden dokumentum:
- verziókövetett,
- visszakereshető,
- jogosultságokkal szabályozott lett.
Javult az adatminőség
Az egységes metaadat-kezelés megszüntette a redundáns és hibás tárolást.
Technológiai előnyök
BroadBit AutoMeta
Fő képességek:
- tömeges migráció,
- OCR pipeline,
- metaadat-normalizálás,
- workflow automatizáció,
- Alfresco integráció,
- skálázható feldolgozás.
collAIgue
Fő képességek:
- AI dokumentumklasszifikáció,
- AI alapú metaadat-kinyerés,
- entitásfelismerés,
- tanítható modellek,
- üzleti kategorizáció.

Összegzés
Az AutoMeta és collAIgue rendszerek kombinációja lehetővé tette egy korábban rendezetlen, heterogén dokumentumkörnyezet teljes automatizált átalakítását.
A projekt eredményeként:
- létrejött egy intelligens vállalati dokumentumtár,
- a dokumentumok kereshetővé és strukturálttá váltak,
- az AI-alapú klasszifikáció jelentősen csökkentette a manuális munkát,
- az Alfresco Content Services rendszerben egy hosszú távon fenntartható, szabályozott dokumentumkezelési környezet alakult ki.
A megoldás különösen hatékony nagyvállalati, közintézményi és erősen szabályozott iparági környezetben, ahol a dokumentumok mennyisége és komplexitása kiemelkedően magas.
BroadBit Hungary
H-2092 Budakeszi, Knáb János utca 8.
Tel.: +36 20 225 3054, +36 20 465 6554
E-Mail: info @ broadbit . hu
WEB: broadbit.hu
Reg.Number: 13-09-213102
TAX ID: 13717445-2-13
EU TAX ID: HU13717445
EU PIC: 999671622