Wdrożenie Polcom AI dla klienta z branży budowlanej
- Karolina Wierzbic
Wdrożenie Polcom AI dla klienta z branży budowlanej
Firma budowlana realizująca inwestycje w zakresie budownictwa mieszkaniowego oraz obiektów wielkopowierzchniowych.
Wykorzystane technologie:
- Polcom AIaaS
- Polcom RAG
Udostępnione zasoby:
Wysokowydajne klastry wyposażone w karty GPU
Cel projektu:
Celem projektu było udostępnienie wysokowydajnej platformy AI z wstępnie wytrenowanym oraz dopasowanym do tego celu modelem językowym. Główną potrzebą klienta było usprawnienie porównywania zapisów w dokumentach technicznych oraz weryfikacja ich zgodności z wewnętrznymi standardami firmy. Klient potrzebował również zapewnienia jednolitego sposobu interpretacji dokumentacji niezależnie od zespołu realizującego analizy.
Dodatkowo weryfikacji podlegać miały dane operacyjne oraz inne elementy ściśle związane z normami jakości stosowanymi w branży budowlanej takie jak:
• specyfikacje techniczne,
• projekty wykonawcze,
• dokumentacje powykonawcze,
• raporty operacyjne,
• instrukcje i procedury,
• normy wewnętrzne.
Zakres projektu:
Projekt obejmował przygotowanie oraz uruchomienie usługi pracującej na współdzielonej platformie dostawcy Polcom. Ze względu na wykorzystanie otwartych silników obsługujących duże modele językowe zaproponowano model Qwen, który świetnie radzi sobie z dokumentami pisanymi w języku polskim oraz nie ma ograniczeń związanych z obsługą dłuższego kontekstu. Dla uzyskania najlepszej wydajności do obsługi zapytań uruchomiono wydzieloną część GPU opartej na kartach z serii RTX6000 Pro Server Edition. Omawiana usługa nie wymagała dodatkowej przestrzeni na zasoby dyskowe, ponieważ wymaganiem było uzyskiwanie szybkich odpowiedzi związanych z oceną przesyłanych treści i ich porównaniem z ustalonym wcześniej wzorcem. Ze względu na dynamiczne potrzeby wykorzystania platformy zaproponowano model billingowy. Klient rozliczany jest za ilość przesłanych danych jako tokeny wyjściowe i wejściowe. Dzięki temu ma możliwość pracy z dostarczonym narzędziem i użycia go na żądanie. Zabezpiecza to również scenariusze związane z czasem zwiększonych potrzeb np. przy zamknięciach kontraktów wewnętrznych klienta.
Rozwiązanie zostało wdrożone w środowisku chmury prywatnej Polcom, co zapewnia pełną kontrolę nad danymi oraz ich suwerenność, istotną w kontekście przetwarzania dokumentacji technicznej i operacyjnej o podwyższonym poziomie wrażliwości. Architektura platformy została zaprojektowana w modelu AI as a Service, z uwzględnieniem podejścia projektowego obejmującego wdrożenie, utrzymanie oraz rozwój systemu. Klient objęty jest również całodobowym wsparciem operacyjnym, co zapewnia ciągłość działania usługi oraz szybkie reagowanie na incydenty i potrzeby biznesowe.
Omawiane rozwiązanie bazuje w całości na gotowym modelu API. W rezultacie użytkownik nie musi zajmować się konfiguracją, utrzymaniem ani optymalizacją modelu. Proces analizy opiera się wyłącznie na danych przekazywanych w zapytaniach oraz na wstępnym przetwarzaniu danych, obejmującym m.in.:
• usunięcie zbędnego formatowania,
• normalizację treści,
• identyfikację sekcji i nagłówków,
• podział na logiczne fragmenty.
Dodatkowo wdrożono mechanizm RAG (Retrieval-Augmented Generation), który umożliwia wykorzystanie wewnętrznej wiedzy organizacji przy jednoczesnym zachowaniu aktualności i spójności odpowiedzi generowanych przez model.
Dzięki wstępnemu przetwarzaniu danych możliwe było ujednolicenie dokumentów pochodzących z różnych źródeł oraz przygotowanie ich do dalszej analizy przez model językowy. Proces ten znacząco wpływał na poprawę jakości odpowiedzi generowanych przez system oraz ograniczenie błędów wynikających z niespójności formatowania dokumentacji.
W ramach projektu przygotowano również zestaw mechanizmów umożliwiających monitorowanie wykorzystania zasobów AI, analizę obciążenia środowiska oraz kontrolę kosztów związanych z przetwarzaniem zapytań. Pozwoliło to na dynamiczne skalowanie zasobów GPU w zależności od aktualnych potrzeb biznesowych klienta.
Środowisko techniczne:
W ramach opisywanego projektu udostępniono środowisko oparte na wewnętrznych klastrach Polcom. Klastry stworzone wyłącznie na potrzeby usługi Polcom AI Cloud wyposażone są w nowoczesną i ultra wydajną przestrzeń dyskową oraz stos kart graficznych. Zasoby GPU przydzielane są elastycznie zgodnie z wymogami projektowymi. Całością zarządza Polcom i udostępnia klientowi dostęp za pomocą interfejsu API.
Każda para fragmentów dokumentów przesyłana jest do modelu językowego poprzez API. Środowisko zostało przygotowane w sposób umożliwiający dalszą rozbudowę infrastruktury wraz ze wzrostem liczby realizowanych projektów AI. Rozwiązanie wyposażone jest w mechanizmy izolacji środowisk oraz separacji danych poszczególnych klientów, co pozwala na zachowanie wysokiego poziomu bezpieczeństwa oraz zgodności z wymaganiami organizacyjnymi.
Do modelu przekazywany jest:
• fragment dokumentu źródłowego,
• fragment dokumentu referencyjnego,
• instrukcja analizy (prompt systemowy),
• kryteria zgodności z wymaganiami klienta.
W odpowiedzi oczekiwane są:
• lista wykrytych różnic,
• poziom zgodności dokumentów,
• wskazanie brakujących elementów,
• sekcje wymagające weryfikacji,
• rekomendacje dalszych działań.
Osiągnięty efekt:
Klient otrzymał dostęp do wysoko skalowalnego środowiska pozwalającego na szybkie wdrożenie projektu. Umożliwiło to uruchamiania zadań dla AI z wykorzystaniem aktualnych wersji modeli językowych i pełne zabezpieczenie środowiska na infrastrukturze Polcom. Klient nie musi dbać o administrację środowiska, która leży po stronie zespołu Polcom. Rozwiązanie wykorzystuje gotowe API udostępniane jako usługa zarządzana. Oznacza to, że dostawca odpowiada za utrzymanie środowiska, dostępność usługi, skalowanie zasobów, aktualizacje oprogramowania oraz monitorowanie i usuwanie awarii. Użytkownik korzysta wyłącznie z udostępnionego interfejsu API i nie musi zarządzać infrastrukturą ani komponentami technicznymi niezbędnymi do jego działania.
Środowisko zostało dodatkowo osadzone w modelu chmury prywatnej Polcom, co zapewnia pełną kontrolę nad przetwarzanymi danymi oraz ich suwerenność, szczególnie istotną w przypadku analizy dokumentacji technicznej i projektowej o wysokim stopniu wrażliwości.
Czas analizy dokumentacji został skrócony o kilkadziesiąt procent. Wyeliminowano pracę manualną, a przez to zwiększono spójność kontroli oraz ujednolicone zasady wykrywania błędów i niezgodności. Dodatkowo system na żądanie proponuje usprawnienia i poprawy tekstu w celu uzyskania zgodności z normami wewnętrznymi i zewnętrznymi. W ramach usługi zapewniono również całodobowe wsparcie operacyjne (24/7), obejmujące monitoring, reakcję na incydenty oraz bieżące utrzymanie ciągłości działania systemu.
Wdrożone rozwiązanie pozwoliło również na standaryzację procesu analizy dokumentacji technicznej pomiędzy różnymi działami organizacji. Dzięki wykorzystaniu jednolitego mechanizmu oceny dokumentów ograniczono ryzyko występowania rozbieżności interpretacyjnych oraz przyspieszono proces akceptacji dokumentacji projektowej. Dodatkowo utrzymano podejście projektowe w modelu AI as a Service, w którym dostawca odpowiada nie tylko za infrastrukturę, ale również za rozwój, optymalizację oraz utrzymanie rozwiązania, co odciąża zespoły klienta i zapewnia przewidywalność operacyjną.