Lokale AI "PA" bouwen voor m'n dementerende vader

Pagina: 1
Acties:

  • martijn1971
  • Registratie: Augustus 2017
  • Laatst online: 19-06 19:35
Ik ben bezig met een Proof of Concept voor een lokale, privacy-vriendelijke "Digital Personal Assistant" voor m'n vader. Doel is een systeem dat z'n geheugen en dagelijkse logica ondersteunt (agenda, herinneringen, feiten) zonder dat er data naar de cloud gaat.

Ik heb met behulp van Gemini een beetje een voor onderzoek gedaan, en we kwamen hier op uit:

1. Doelen
  • Cognitieve ondersteuning: Het systeem fungeert als een "externe prefrontale cortex". Het moet een zakelijke PA-persona hebben: feitelijk, kort, bondig en geen "AI-gepraat".
  • Proactief & Focussed: Het systeem moet zelfstandig 's ochtends kunnen "ankeren" (tijd/datum/agenda) en relevante informatie geven zonder moraliserend te zijn.
  • Privacy: Alles 100% lokaal (Home Assistant/Ollama-based).
2. Software
  • Hub: Home Assistant op een Mac Mini(64GB).
  • Pipeline: Wyoming Protocol voor audio.
  • Brain: Ollama (Llama 3.1) + LangGraph voor de agentic flow.
  • Geheugen: Vector DB (ChromaDB) voor de "Ledger" (historie/afspraken).
  • Search: SearXNG voor feitelijke info (nieuws, TV-gids, namen).
3. Hardware
  • Brain: Mac Mini M4 Pro (64GB RAM) voor de lokale LLM-kracht.
  • Client (Keuken): Of de Home Assistant Voice Preview Edition, of een Raspberry Pi 5 + ReSpeaker XMOS 4-Mic Array (voor AEC).
  • Input: Home Assistant Companion App op z'n iPhone (triggers voor o.a. bellen).
- Algemeen, gaat dit werken?

- Heeft iemand hier al zoiets gedaan?

- Hoe zit het met de audio-latency/snelheid bij het gebruik van de Home Assistant Voice Preview Edition vs. een DIY Pi-setup?

  • BernardV
  • Registratie: December 2003
  • Laatst online: 10:31
Dit zou moeten werken, alleen qua snelheid is het nog wel de vraag.
Ik zou eerst eens een paar tests draaien met een Qwen3-30B-A3B model of de qwen:14b op Ollama. Ik heb ook een M4 Pro en daar haal ik ongeveer 35-40 tokens/sec, dat is leuk voor automatisering, maar als je snel reactie verwacht is dat te traag.

Dus om herinneringen e.d. te tonen prima, om audio om te zetten naar tekst, te zoeken in je vectordatabase en reactie te geven is het aan de trage kant.

Om te indexeren in een vector-database kun je ook het Ollama bge-m3 model gebruiken, die werkt prima.

Maar ik zou het gewoon eens testen, misschien is het ook wel acceptabel.

  • Mandrake466
  • Registratie: Oktober 2005
  • Laatst online: 15-06 19:58
Ik heb er de ballen verstand van maar ik wil jou en je vader heel veel sterkte wensen!

Windows 11 Pro, I7-12700K, MSI MPG Z690 EDGE WIFI DDR4, MSI RTX 3090 TI Suprim X 24G, Noctua NH-D15 chromax black, Corsair Vengeance LPX 3200C16 128GB, Seasonic Prime TX-850, Samsung 980 Pro 2TB, Fractal Design Torrent


  • DeNachtwacht
  • Registratie: December 2005
  • Niet online
Al eens gedacht aan opzetten van een OpenClaw / Hermes agent? Qwen 3.6 27B draait echt prima in 64GB ram op een mac met 256K context en mijn ervaring is ook wel positief als je eenmaal door de wat stijle leercurve bent (denk aan emails checken, dagelijkse reminders geven, emails versturen, nieuws verzamelen et cetera). Je kan de PA persona met de agent.md ook best aardig personaliseren hoewel AI natuurlijk wel altijd AI blijft. Maar als ik nou heel eerlijk ben lijkt dat hele opgesomde rijtje van je ook best een AI gegenereerde tekst ;) een hoop bla, maar weinig feitelijk wat je nou precies wil bouwen en wat daarvoor nodig is.

Voordeel van OpenClaw of Hermes is iig ook dat je hem zo kan instellen dat je gewoon via telegram of signal tegen de bot praat alsof het een persoonlijke assistent is (zelfs audio invoeren werkt prima). Maar het is technisch best even puzzelen voor je het werkend hebt, dus kortom als mijn aanname van hierboven juist is vraag je dan af of je het wel zelf in kan gaan regelen allemaal, een beetje hulp van AI is prima maar als je bij het instellen 95% van de kennis uit AI moet hebben en maar 5% van jezelf is het een minder goed idee denk ik. :P

[ Voor 31% gewijzigd door DeNachtwacht op 15-06-2026 15:37 ]


  • martijn1971
  • Registratie: Augustus 2017
  • Laatst online: 19-06 19:35
Ik denk toch dat OpenClaw/Hermes overkill is, tevens dat 32k context meer dan genoeg is.

Ik ga nu eerst beginnen met Home Assistant Voice Preview Edition en kijken of ik simpele communicatie in het nederlands tussen mijn vader en de AI aan de praat krijg.

  • DeNachtwacht
  • Registratie: December 2005
  • Niet online
Ja ben eens hoor dat Openclaw wel stapje complexer is en het doel voorbij schit, maar dacht ik opper het wel even want als je er écht een assistent van wil maken die (ipv automations) je vader aan de broek gaat trekken als hij inschat dat het belangrijk is, zijn de mogelijkheden wel groter :P

Maar het is ook nog best een programma waarbij pionieren/rauwe randjes een rol speelt dus idd zeker niet in alle gevallen handig.

  • martijn1971
  • Registratie: Augustus 2017
  • Laatst online: 19-06 19:35
je vader aan de broek gaat trekken als hij inschat dat het belangrijk is, zijn de mogelijkheden wel groter :P
Ja, dit gaat mij te ver, AI is memory/stenograaf/googler, ik ben de brains.....voorlopig...

  • DeNachtwacht
  • Registratie: December 2005
  • Niet online
Ik ben wel benieuwd iig naar je ervaringen, houd ons op de hoogte :)

  • GioStyle
  • Registratie: Januari 2010
  • Nu online
Het project zal vast werken, maar waarschijnlijk niet voor je vader. Iedereen is anders en dementie verloopt bij ieder persoon op zijn eigen manier, maar uit ervaring weet ik helaas dat (technische) oplossingen voor (praktische) problemen vaak niet werken zoals bedacht.
Pagina: 1