Miten mintbot käsittelee tiedostoja¶
Kun lähetät mintbot-agentillesi valokuvan, dokumentin, ääniviestin, taulukon, kuvakaappauksen tai PDF:n — Telegramin, web-paneelin tai API:n kautta — tiedosto ei kulje mintbotin keskusinfrastruktuurin kautta matkalla kielimalliin. Se laskeutuu suoraan agenttisi omalle VPS:lle, jää sinne niin pitkäksi aikaa kuin haluat, ja LLM saa sille optimoidun kopion.
Tämä on hiljainen suunnitteluvalinta, jolla on äänekkäät seuraukset. Se kannattaa avata, sillä se on yksi suurimmista paikoista, joissa mintbot eroaa kuluttaja-LLM-chatista.
Vuo päästä päähän¶
-
Lataus saapuu agentin VPS:lle. Telegramin valokuva, web-paneeliin pudotettu PDF, ääniviesti, chattiin liimattu kuvakaappaus. Agentin paikallinen API ottaa tavut vastaan, nuuhkaisee magic-headeria selvittääkseen, mikä tiedosto oikeasti on (puhelimet ja selaimet merkitsevät ne yllättävän usein väärin), laskee SHA-256-tiivisteen ja kirjoittaa tiedoston polkuun
/var/lib/mintbot-agent/uploads/<shard>/<sha256>.<ext>agenttisi omalla VPS:llä. Paikalliseen luetteloon menee rivi, jossa on lähde (telegram / panel / api), lataajan ID, MIME-tyyppi ja alkuperäinen tiedostonimi. -
Alkuperäinen on pyhä. Tästä eteenpäin mitään mintbotin sisällä ei enää koskaan muuteta tallennetussa tiedostossa. Adapterit, jotka valmistelevat sen LLM:ää varten, tuottavat vain työkopioita — pienennettyjä JPEG-tiedostoja, koodausta vaihdettua tekstiä, irrotettuja pikkukuvia. Tavu tavulta -alkuperäinen pysyy levyllä, kunnes poistat sen agentin tiedostohallinnan kautta. Ei keskitettyä bucketia, ei säilytysaikalaskuria, ei agenttien välistä vuotoa: jokainen agentti-VPS tuntee vain oman omistajansa lataukset.
-
Malli saa LLM-optimoidun version. Kun agentti päättää näyttää tiedoston LLM:lle, pieni dispatcher valitsee MIME-tyypin ja päätteen perusteella oikean adapterin, ja adapteri tuottaa sisältölohkoja, joita malli osaa lukea:
Adapter Käsittelee Tulos Image JPG, PNG, WebP, GIF, HEIC (iPhone), AVIF ja muu mitä Pillow osaa avata Skaalattu enintään 1568 px pitkälle sivulle, koodattu uudelleen JPEG q85:nä, base64-inline mallin kontekstiin PDF .pdf≤ 32 MBBase64-inline natiivina PDF:nä (Anthropicin mallit lukevat sen suoraan) Text .md,.csv,.json,.yaml, lähdekoodi (.py,.js,.ts,.go,.rs, …), lokit, diffitUTF-8-dekoodattu (latin-1 varalla), inlineksi tekstinä kokorajaan asti Audio .mp3,.ogg,.opus,.m4a,.wav,.flacTelegramin ääniviestit bot litteroi jo inline; suorat lataukset saavat toistaiseksi paikkamerkin, Whisper STT seuraavassa aallossa Video .mp4,.mov,.webm,.mkvToistaiseksi paikkamerkki; ffmpeg-keyframe + äänen litterointi tulevat myöhemmässä aallossa Office docs .docx,.xlsx,.pptx,.odt,.ods,.odpToistaiseksi paikkamerkki; natiivi tekstin irrotus (python-docx / openpyxl / python-pptx) tulee myöhemmässä aallossa Unknown Kaikki muu Tekstipaikkamerkki: "käyttäjä liitti <mime>-tiedoston, se on levyllä lataus-ID:llä<id>" — jotta malli voi vähintään päätellä, mitä lähetettiinJokainen muunnos välimuistitetaan alkuperäisen viereen tiedostona
<sha256>.cache/v<N>.json, joten kun malli tarvitsee tiedoston seuraavan kerran, lataus on välitön. Adapterin version nosto invalidoi välimuistin automaattisesti. -
Ei vanhenevia URL:eja mallin kontekstissa. Kun kuva tai PDF menee LLM:lle, se upotetaan base64-inlineksi samalla vuorolla — ei URL:ää, joka voisi myöhemmin antaa 404, ei ajastettua allekirjoitettua linkkiä. Suurempien tiedostojen kohdalla, joissa malli tarvitsee vain osoittimen, URL on sisäinen
https://agent<id>.<domain>/<panel_token>/api/local/uploads/<upload_id>/raw— suojattuna oman agenttisi paneeli-tokenilla, voimassa niin kauan kuin tiedosto pysyy levyllä.
Miksi tämä voittaa kuluttaja-LLM-chat-kokemuksen¶
Kun lataat valokuvan ChatGPT:hen tai PDF:n Claude.ai:hin, tiedosto menee tarjoajan tallennukseen, liitetään siihen keskusteluun, ja tarjoajan säilytyslinjaus päättää, milloin se häviää. Tietyn iän jälkeen tiedosto on poissa, vaikka näkisit vielä keskustelun, jossa se eli. Tarjoajan vaihtaminen tarkoittaa alusta aloittamista.
Yleinen Telegram-bot-ansa tekee eron konkreettiseksi. Telegram itse säilyttää jokaiselle valokuvalle pysyvän file_id-tunnisteen, mutta kolmannen osapuolen botit, jotka noutavat tiedoston Telegramin file_id:llä, saavat väliaikaisen URL:n, joka vanhenee 24 tunnin kuluttua. Vanhemmat botit, jotka viittaavat eilisen valokuvaan, palauttavat 404:n. Mintbot ratkaisee tämän kertarysäyksellä: nähdessään Telegram-tiedoston ensimmäistä kertaa se lataa tavut uudelleen ikuisesti voimassa olevan file_id:n kautta ja kopioi ne sinun agenttisi arkistoon. Siitä hetkestä lähtien valokuva on sinun.
Tästä suunnittelusta seuraa kolme asiaa:
- Tiedostot kuuluvat sinulle, eivät LLM-tarjoajalle. Jos vaihdat ensi kuussa Claudesta GPT-5:een, tiedostohistoriasi tulee mukana, koskemattomana, koska se on sinun VPS:lläsi — ei jonkun toimittajan bucketissa.
- Voit kysyä uudelleen myöhemmin. "Kolme kuukautta sitten analysoit minulle sopimuksen — voitko verrata sitä tähän uuteen luonnokseen?" toimii, koska alkuperäinen on yhä levyllä. Kuluttaja-chatissa vanhempi tiedosto on tyypillisesti jo poissa.
- Malli saa aina version, jota se osaa käyttää parhaiten. Näkömallit saavat skaalatun JPEG:n, tekstinlukijat saavat UTF-8:n, PDF-lukijat saavat natiivin PDF:n. Puhelimet voivat ladata HEIC:n ja se vain toimii — Pillown HEIF-plugin ladataan käynnistyksessä, ja magic-byte-nuuskija nappaa puhelimet, jotka merkitsevät latauksen väärin
application/octet-stream-tyyppiseksi.
Missä hallitset tiedostojasi¶
Agentin web-paneelissa on yläpalkissa tiedostohallinta. Se selaa koko agentti-VPS:n, ja latausten arkisto /var/lib/mintbot-agent/uploads/ on se osa, jota keskustelusi täyttävät. Sieltä voit:
- Nimetä uudelleen, poistaa tai siirtää ladattuja tiedostoja
- Selata päivämäärän, lähteen tai tiedostonimen mukaan
- Pudottaa uusia latauksia drag-and-dropilla (chunkattu, tukee usean gigatavun tiedostoja)
- Muokata pieniä tekstitiedostoja inline
Tiedoston poistaminen paneelista poistaa sekä itse blobin että luettelorivin. Agentti ei pysty enää näyttämään sitä LLM:lle. Tämä on se, mikä tekee alkuperäisestä "sinun omasi": sinä olet ainoa, jolla on poisto-oikeus.
Loppupäätelmä¶
Useimmat LLM-chat-tuotteet kohtelevat lataamiasi tiedostoja ohimenevänä keskustelukontekstina. Mintbot kohtelee niitä sinun datanasi — tallennettuna sinun VPS:lle, sinun omistuksessasi, pyynnöstä muotoiltuna juuri siihen muotoon, jota malli kullakin vuorolla parhaiten käyttää. Suuri osa mintbotin kiinnostavammista kyvyistä lepää tällä perustalla.