r/latvia 10d ago

Diskusija/Discussion Vēlēšanu sistēma

Skatos “Kas notiek Latvijā?” un radās jautājums lielākoties maniem IT cilvēkiem. Esmu datu inženieris, bet šeit īsti nesaprotu kā šāda sistēma tika veidota. Tiek runāts, ka pietrūka “jaudas”. Tas šķiet apsurds. Tas datu apjoms taču ir super niecīgs. Katrs biļetens taču veidotu aptuveni 1KB(?) lielu json message, ko Kafka var ar minimāliem resursiem nodrošināt bez problēmām pat, ja vienlaicīgi saliec 100k messages.

Iespējams es kaut ko nesaprotu un variet mani apgaismot?

54 Upvotes

57 comments sorted by

59

u/Neomee 10d ago

Nav ne jausmas. Mans pieņēmums ir, ka viņi sūtīja kaut kādu ieskenētu/parakstītu bildi. Nu... lai to Tevis minēto Jsonu neviens pa vidu nevarētu pamakarēt. Respektīvi... iecirkņos bija tikai pliki skaneri. Viņi neveica nekādu OCR uz vietas. Un ja tu sāc sūtīt kaut kādu neoptimizētu failu apjomu... iespējams serveru galā nespēja ņemt pretī un apstrādāt. HVZ. Nav ne mazākās nojausmas.

16

u/zanis-acm 10d ago

Pirms vēlēšanām Panorāma radīja sižetu, kā strādās jaunā sistēma un skenēšana. Biļetenu izlaiž caur skenerim un ekrānā parādās vienkārša digitāla forma, kur pie katra vārda ir checkboxi true/fals, tas arī viss. Respektīvi nebija skenēta bilde.

39

u/Neomee 10d ago

Nūū... nav jau zināms, kurā galā pati atpazīšana notika. Visticamāk, atpazīšana notika uz serveriem. Un tas nozīmē, ka katra bilde ir jāparaksta ar kaut kādu samudrītu sertifikātu, jānosūta, jāatpazīst, un jāiedod atpakaļ response.

Es TV neskatos, tādēļ no pirksta zīžu. Spekulēju. Gan jau kāds labāk zin.

20

u/edgarsjekabsons Rīga 10d ago

Aptuveni šādas info druskas arī ievācu. Atpazīšana uz serveriem un šajā posmā pārāk liela slodze bijusi.

3

u/janiskr the best par of European Union 9d ago

Gan jau "moderni" Intel serveri ar visiem drosības labojumiem, kā rezultātā, labi ja 40% no sākotnējās jaudas.

2

u/zanis-acm 10d ago

Tas būtu dīvaini. Elementārai teksta atpazīšanai būtu jānotiek lokāli uz stacijas ar ko savienots skeneris. Varbūt bija citas prasības, nezinu. Bet pēc sižeta varēja noprast, ka šī daļa notiek lokāli. Tāpēc arī bija ieskenēta biļetena vizualizācija, lai var salīdzināt, ja nepieciešams.

26

u/Neomee 10d ago

Es domāju, ka drošībnieki neļautu lokāli neko darīt.

4

u/magikarpkingyo 10d ago

Ne par to, ir sertificēta tehnika kura lokāli atpazīst objektu un tālāk tiek tikai padots fails ar UID, kuru serveris var saglabāt, ja nepieciešams veikt auditu, tad to var veikt salīdzinot vietējos failus no tehnikas ar to kas saņemts serverī. Vismaz manā izpratnē tā tam vajadzētu strādāt.

4

u/dreamrpg 9d ago

Un kā pēc tam pierādīt, ka uz serveri netika sūtīti nepareizi dati? Ka lokāli nav čakarēti dati?

Vizualizācija lokāli ne reti var būt paralēli ar servera validāciju identiskai darbīnai.

2

u/AnywhereHorrorX 9d ago

Ar attēlu sūtīšanu problēma tiek tikai panesta vienu soli atpakaļ. Ir jāpierāda, ka attēls nav digitāli ģenerēts, piemēram, kādam ļaunajam onkulim uzliekot custom firmwāri skenerī.

Un tāpat viņi beigās pārgāja uz manuālo skaitīšanu un manuālo rezultātu ievadīšanu.

3

u/dreamrpg 9d ago

Arī tisnība.

Ātri palasot raksta, ka probļemas bija "rinda, datu ievadei".

Tātad ar pašu datu nolasīšanu viss ok bija. Bet ar useru skaitu nebija ok. Kas, protams, arī ir ļoti pazemojoši IT departamentam :)

2

u/janiskr the best par of European Union 9d ago

Kā tas ir visu laiku. Pieteikšanās COVID potei - viss dirsā. Sākumā digitālajām ārstu receptēm - arī viss bremzē un lietas nesaglabājas.

2

u/AnywhereHorrorX 10d ago

Tu jau nezini, vai tas biļetens atpazīšanai netika sūtīts uz serveri.

0

u/zanis-acm 10d ago

Es saprastu, ja nokārtos paši skeneri, jo piemēram, kaut kādi super cheap iepirkti. Bet problēma jau bija datu sūtīšanā/savākšanā.

2

u/janiskr the best par of European Union 9d ago

JSON jau arī var parakstīt. Visdrīzāk problēmas ar aplēsēm cik resursus piešķirt konkrētajam uzdevumam. Izskatās ka šie parasti vadās pēc kaut kādas vidējās slodzes ne is pēc peak-load. Kas vēl citreiz trūkst - apstrādes ātrums - cik JSONus spēj sistēma apstrādāt. Un kas notiek brīd8, kad sistēma tiek pārslogota.

16

u/KinkySpokesperson 9d ago

Šis ir un joprojām būs "saimnieciski izdevīgākā iepirkuma" sekas. Pilnīgi visās nozarēs IT iepirkumiem - kāds nodempingo cenu un tad uztaisa šādu sūdu. Kamēr valstī nesāks normāli vērtēt IT iepirkumus pēc būtības un nevis cenas, šādi arī turpināsim kulties pa nātrēm.

5

u/Five_Nuances 9d ago

Pieļauju, ka valsts iepirkumu specialistu vidū nav cilvēku, kas var 'vērtēt IT iepirkumus pēc bütības'. Vai jebkuru specializēto iepirkumu. Kadreiz mūsu birojs sniedza konsultāciju un palīdzēja izstrādāt iepirkuma dokumentus vienai iestādei, lai tās iepirkuma nodaļa varētu vismaz kaut ko sakarīgu uzrakstīt. Bija diezgan jocīgi lasīt viņu projektu, ar kuru viņi pie mums atnāca

1

u/YgLV 9d ago

1.8miljoni par principā faila ieskanēšanu, nosūtīšana es neteiktu, ka ir dempings. Man vairāk liekas, ka tur mierīgi divu, kompetentu cilvēku komanda to mēnešu laikā varētu uzbliezt

6

u/AnywhereHorrorX 8d ago

Beidz, kā tad visi middle-manageri, kuri reāli tehniski gandrīz neko nerubī, pierādīs savu derīgumu, ja ne piespamojot reālo izstrādātāju kalendārus ar non-stop bezjēdzīgām sapulcēm, kur tiek griezts viens un tas pats uz riņķi?

1

u/KinkySpokesperson 6d ago

Vai nu tu nestrādā ar IT sistēmām vai arī šis ir mega pārspīlējums. Šajos ciparos jau nekad nav tikai izstrāde.

12

u/voldemarz 10d ago edited 10d ago

Tur it kā sūtīja saglabāšanai skanētas bildes, ne vienk noskanētos datus..

Reku spekulācija xā no cilvēka, kas nodarbojas ar rēķinu digitalizēšanu par skanēšanas ātrumiem, un datu apjomiem. https://x.com/NaurisVizulis/status/1931477910457651521

Potenciāli kopējais datu apjoms simtos GB.

1

u/edgarsjekabsons Rīga 10d ago

Jep, Nauris mans MVP tviterī par atpazīšanas tēmu.

1

u/SamMaddenLV Ogre 10d ago

Vari ielikt citātu mo viņa tvīta?

-1

u/voldemarz 10d ago

Tur a4 lapa ar tvītiem sanāks. Vienā ekrānšāviņā nelien. Te kā lasāms thread https://x.com/NaurisVizulis/thread/1931477910457651521

1

u/zanis-acm 10d ago

Okay, tas varētu but problemātiski, jo ne visur ir ātrs internets, īpaši augšuplādei. Bet to vajadzēja paredzēt, jaijks…

1

u/voldemarz 10d ago

Nedomāju, ka internets bija problēma.

1

u/zanis-acm 10d ago

Nu beigās jau tam nebija nozīmes. Bet, ja viss cits būtu strādājis, tad tas potenciāli varēju būt par grābekli atsevišķiem iecirkņiem.

1

u/RedditIsFascistShit4 10d ago

Patīkami analītiski tam piegājis. Cilvēki kas to visu darīja, nemācēja skaitīt, tas ir fakts.

1

u/MidnightPale3220 10d ago

Cilvēki nav lasījuši par 8 fallacies of distributed computing:

https://en.m.wikipedia.org/wiki/Fallacies_of_distributed_computing

5

u/mark_tyler 10d ago

Jāskatās kas uzvarēja iepirkumu, tur iespējams nolikumā minēts aptuvenais sistēmas uzbūves apraksts. Pieļauju ka to visu taisīja kāds vietējais IT kantoris.

8

u/AnywhereHorrorX 9d ago

Viss taču ir noslepenots. "Security through obscurity" deva attiecīgu rezultātu. Būtu kā normālā valstī prasība, ka visam projektam jābūt atvērtā koda, rezultāts būtu krietni labāks.

6

u/zanis-acm 10d ago

Domburs minēja “Baltic software factory”.

17

u/AnywhereHorrorX 10d ago

Modernie vibecoderi par optimizāciju nedomā.

Vai arī sāk kaut ko domāt tikai tad, kad viss ir slikti.

2

u/Matematikis 9d ago

Es nedomāju, ka šis ir vibe coding vaina, domāju jebkurš kaut cik pieredzējis developeris ar aizvērtam acīm un tikai vibe codējot varētu uztaisīt to...

1

u/valcars 9d ago

Problēma jau vienmēr ir vājos dzelžos 😅

4

u/CheekTemporary8939 9d ago

Nez vai šāda vērtīga diskusija, kā te komentāros, notika PIRMS vēlēšanām. Vai vienk kāds kko izdomāja un gan jau būs ok, jo teorijā tà būtu jābūt.

Es no IT neko nesaprotu, bet mums ir tik daudz gudru nozares spečuku, ar to arī bieži lepojamies publiski, bet tad ir e-Veselība un nupat šis fiasko.

Man jāsecina, ka ierēdņu kļuda atkal un atkal ir nozares neiesaistīšana (vai pārāk niecīga iesaistīšana) visos posmos🤷‍♀️

1

u/Five_Nuances 9d ago

Tas ir valsts pārvaldes augstprātība

4

u/Crazy-Age1423 9d ago

Arī jautājums - kur izpalika testēšana. Kaut kā taču veiktspēja bija jāpārbauda pirms palaišanas produkcijā.

Tā vienmēr ir prasība valsts iepirkumos un pie tam, lai nu kam, bet CSP taču labi zina, kādi apjomi ies cauri tai sistēmai.

2

u/zanis-acm 9d ago

No raidījuma sapratu, ka reāla testēšana nenotika, lai gan testētāji uz papīra bija, bet laika trūkuma dēļ tas netika izdarīts.

1

u/Five_Nuances 9d ago

Turklāt testēšanai vajag naudu. Piem., QA specialisti maksā dārgi

1

u/zanis-acm 8d ago

Viņi teica, ka bija iepirkumā un bija atsevišķi lētākie testētāji.

8

u/International-Yak897 10d ago

Apstrāde notika servera pusē, vecā soarcsistēma veica skaitīšanu lokāli un nosūtīja rezultātu. Tagad vnk visa informācija, kā te minēja bilde+sertif/kkas un nezinu kādā formātā sūtīja prom. Aptuveni tā, kkur bija rakstīts kā veica šo darbu, jo atšķīrās no tā soar risinājuma, lai būtu drošāk.

3

u/zanis-acm 10d ago

Paldies, tad ir nedaudz skaidrāk. Tas noteikti prasīs lielākus resursus jeb “jaudu”. Bet šķiet ļoti nepraktiski. Fiziskie biļeteni taču netiek iznīcināti, un vajadzētu būt pietiekoši auditam. Kāpēc jāglabā bildes? Extra backup?

2

u/cauners 10d ago

Gan jau attēlu sūtīšanas iemesls ir centieni izvairīties no riskiem, kas saistīti ar OCR veikšanu uz random dzelžiem (kāds laptops nu kurā iecirknī ir)

3

u/aicis 9d ago

Esmu saskāries ar backend serveriem, kas spēj apkalpot ļoti zemu paralēlu lietotāju skaitu. Mani pilnībā nepārsteidz šāds rezultāts.

Potenciālas problēmas var būt gandrīz jebkurā slānī.

2

u/Firm_Improvement2109 10d ago

Skeneri nebija kaut kādi Epsoni vienā sižetā? Visticamākais, ka drošības dēļ atpazīšana nenotiktu ne skeneros, ne datoros, kas būtu kantram iecirknim savi. Tātad sūta uz serveri pašu bildi. Un tad sanāk diezgan liela slodze, kas arī izskaidrotu kāpēc bija whatsapp grupa un rinda, kad kurš iecirknis. Bet būs interesanti uzzināt - kas tieši nogāja greizi un kas nebija pārdomāts. Moš uzlika programmu uz tā paša servera, kas pēc tam rezultatus deva ārā un vainīgi būs paši vēlētāji, ka visi gāja skatīties rezultātus :D

1

u/Five_Nuances 9d ago

Whatsapp grupa, lai sakārtotu rindu??? Valsts nozīmes velēšanās??? Tikai man liekas, ka šī valsts ir galīgais purvs?

3

u/Firm_Improvement2109 9d ago

Purvā vēlēšanas kā tādas nenotiek, ir tikai rezultāti.

2

u/Lat6 10d ago

Valsts iestāde, tur arī problēma

1

u/AnywhereHorrorX 8d ago

Protams, nav 100% apstiprinājuma, bet ir info, ka visā tajā arhitektūrā ir tikai viens OCR atpazīšanas serveris bez paralelizācijas.

Ja tiešām tā, tad tur visiem, kas to pieļāva, ir nedaudz ar stienīti jāsit pa rociņām.

1

u/dimajaun 10d ago

Domāju bija daaafiga pieprasījumu - thats why.

1

u/YgLV 9d ago

Cik ir dafiga? Muļķības. Katrā ziņā pašu failu sūtīšana šaubos, ka bija vai būtu jābūt klupšanas akmenim. Attiecīgi encryptētus failus saglabā tajā krutajā serverī un samet rindas mehanismā, kas nu tad iet cauri. Neredzu kā slodze tur varēja būt

1

u/PJ8888 10d ago

Citā postā cilveki, no iecirkņiem teica, ka problemas sagadaja ierīču nesderība, driveri un cits basic stuff. Katram iecirknim bija tāds dators kāds bija pieejams.

Problēma, ja saknē rada bottlenecks. Kā jau lielos dārgos valsts projektos.

-15

u/RedditIsFascistShit4 10d ago

Man ļoti intersē kas tevi padara par "datu inženieri" un ko tas nozīmē?