Toon posts:

Datacompressie van een student uit India

Pagina: 1 2 Laatste
Acties:
  • 679 views sinds 30-01-2008
  • Reageer

  • 0rbit
  • Registratie: Maart 2000
  • Laatst online: 18-03-2021
Een topic over dataopslag lijkt mij heel interessant. En tja, dat niet iedereen het met je eens is en soms een gat in een idee schiet; daar moet je tegen kunnen vind ik als je op dit soort manieren over deze onderwerpen wil praten. Dat is toch echt de enige manier waarop de mensheid zelf vooruitgang op kennisgebied heeft geboekt. Als je zelf geinteresseert bent in wat andere mensen voor ideeen hebben zou ik gewoon zo'n topic posten... :)

Ik ben geheel voldaan, dank u wel!


  • Opi
  • Registratie: Maart 2002
  • Niet online

Opi

Even een stukje over datacompressie en informatiedichtheden.
Als eerder door Confusion opgemerkt werd is informatie een grootheid waarvan de dichtheid gemeten wordt in bits. Informatie is gerelateerd aan zelfinformatie waarmee de informatiedichtheid berekend kan worden en is gerelateerd aan entropie. Hiermee is ook direct het gebruik van kansen geïntroduceerd. De hoeveelheid zelfinformatie is per definitie uitsluitend afhankelijk van de kans p op die gebeurtenis. Hierbij is de zelfinformatie groter naarmate de onzekerheid toeneemt, omdat er kennis wordt toegevoegd aan het systeem die nog niet aanwezig is en er zodoende minder redundantie is. De formule voor de hoeveelheid zelfinformatie;
H(A) = - 2log(p) (bit)
Hierbij is de 2 niet gerelateerd aan het gebruik van bits en p de kans dat een gebeurtenis zich voordoet.

De grootte van hedendaags gebruikte transistoren is dermate klein dat het gebruik van kleur aan een transistor geen werkbare situatie is. Er zal zodoende gezocht moeten worden naar alternatieven en naar ik meen (aan elke natuurkundige om dit te verbeteren of te ontkrachten) kunnen de bedachte modellen voor kwantumcomputers hiervoor een uitkomst bieden.

  • 0rbit
  • Registratie: Maart 2000
  • Laatst online: 18-03-2021
Je kunt de hoeveelheid zelfinformatie ook schrijven in "nats" als je geen 2 log neemt maar gewoon de natuurlijke logaritme. Niet dat het veel uitmaakt :+

Hoe voeg je overigens kleur toe aan een transistor? Wat moet ik me daarbij voorstellen?

Ik ben geheel voldaan, dank u wel!


  • sopsop
  • Registratie: Januari 2002
  • Laatst online: 19-12 16:34

sopsop

[v] [;,,;] [v]

Even heel wild denkend hoor:
Stel dat je ieder bitje op een DVD ook van een kleur kan voorzien. Het medium (de DVD) blijft dan even groot en de 'bitjes' staan even ver van elkaar. Stel je kunt een variantie van 256 kleuren genereren. Dan kun je dus 256 keer zoveel data opslaan op een zelfde soort medium.

En voor wat betreft de symbolen die op het papiertje gezet worden: een symbool hoeft natuurlijk niet uit 1 kleur te bestaan, je zou ook meerdere kleuren in 1 symbool kunnen gebruiken. Dan groeit de opslag natuurlijk exponentieel.

  • Janoz
  • Registratie: Oktober 2000
  • Laatst online: 26-12 14:18

Janoz

Moderator Devschuur®

!litemod

Tja.. 'een bitje op de DVD 256 verschillende kleuren geven' is het zelfde als op de plek van dat bitje 8 bitjes neer te zetten. Geen compressie. Dat staat natuurlijk geheel los van het feit dat op die afmetingen er geen kleuren meer bestaan.

Daarnaast groeit de opslag capasiteit niet exponentieel. De opslaanbare mogelijkheden groeien exponentieel, maar dat is equivalent met een lineair groeiende opslag ruimte.

[ Voor 26% gewijzigd door Janoz op 01-12-2006 12:12 ]

Ken Thompson's famous line from V6 UNIX is equaly applicable to this post:
'You are not expected to understand this'


  • 0rbit
  • Registratie: Maart 2000
  • Laatst online: 18-03-2021
Janoz schreef op vrijdag 01 december 2006 @ 12:09:
Tja.. 'een bitje op de DVD 256 verschillende kleuren geven' is het zelfde als op de plek van dat bitje 8 bitjes neer te zetten.
Dank je. Jij snapt het.

Ik ben geheel voldaan, dank u wel!


  • Pascal
  • Registratie: Januari 2001
  • Laatst online: 25-12 04:07
http://www.trnmag.com/Sto..._data_storage_013101.html

Ook wel leuk stukje over "opslag"
With this in mind, a team of researchers the University of Cincinnati is using the different colors of light reflected from tiny holes in a thin film of silicon dioxide to gain many different colors that can be used to encode bits. The color of the reflected light depends on the depth of the hole. Like magnetic media, each bit still has two states, but "at every location I can have multiple bits," said Andrew Steckl, a professor of solid-state microelectronics and director of the Nanoelectronics Laboratory at the University of Cincinnati.

[ Voor 27% gewijzigd door Pascal op 01-12-2006 12:17 ]


  • Delerium
  • Registratie: Mei 2000
  • Niet online

Delerium

Mythology

Mr_Atheist schreef op donderdag 30 november 2006 @ 22:39:
Hoe voeg je overigens kleur toe aan een transistor? Wat moet ik me daarbij voorstellen?
Niet. Maar je zou natuurlijk de kleur kunnen uitlezen als byte. Dat scheelt je 7 puntjes aan dataopslag.

  • Confusion
  • Registratie: April 2001
  • Laatst online: 01-03-2024

Confusion

Fallen from grace

Mr_Atheist schreef op donderdag 30 november 2006 @ 22:39:
Hoe voeg je overigens kleur toe aan een transistor? Wat moet ik me daarbij voorstellen?
Je zou in plaats van gelijkstroom wisselstroom kunnen gebruiken[1] en een kleur toekennen aan bepaalde frequentiegebieden. Of je zou het energiespectrum van de electronen die door de transistor komen kunnen bepalen en daar per schaaldeel een 'kleur' aan koppelen (om wat vage definities van 'kleur' te introduceren die niet minder excentriek zijn dan de indeling van quarks in 'kleuren').

[1] Het levert heel wat nare problemen en moeilijkheden op, maar dit is alleen maar for the sake of argument

Wie trösten wir uns, die Mörder aller Mörder?


  • 0rbit
  • Registratie: Maart 2000
  • Laatst online: 18-03-2021
Confusion schreef op vrijdag 01 december 2006 @ 13:30:
[...]

Je zou in plaats van gelijkstroom wisselstroom kunnen gebruiken[1] en een kleur toekennen aan bepaalde frequentiegebieden. Of je zou het energiespectrum van de electronen die door de transistor komen kunnen bepalen en daar per schaaldeel een 'kleur' aan koppelen (om wat vage definities van 'kleur' te introduceren die niet minder excentriek zijn dan de indeling van quarks in 'kleuren').

[1] Het levert heel wat nare problemen en moeilijkheden op, maar dit is alleen maar for the sake of argument
Conclusie: het heeft helemaal niks met de golflengte van electromagnetische straling te maken :+ Dat je een golflengte kunt meten en kwantificeren om deze vervolgens in de toestand van een bepaald object vast te leggen, dat is triviaal. De vraag is meer: "Hoeveel informatie kun je met een transistor beschrijven?" Die vraag is weer direct gelinkt aan: "In hoeveel verschillende toestanden kun je een transistor brengen?".

Het leuke is dat de statistiek van de toestand van een transistor bepaald hoeveel informatie deze daadwerkelijk bevat. Als deze bij iedere keer uitlezen dezelfde toestand heeft, dan bevat hij geen informatie. Als de kans op de ene toestand gelijk is aan de kans op de andere toestand, dan is de toestand van de transistor maximaal onzeker en dan beschrijft het uitlezen van de transistor een maximale hoeveelheid van 1.44 nat (of 1 bit dus) gegeven 2 mogelijke toestanden.

Een transistor die 20% van de tijd een nul voorstelt en 80% van de tijd een 1 bevat een informatie gelijk aan: I = - ( 0.2log2(0.2) + 0.8log2(0.8) ) ~ 0.72 bits. Hetzelfde geldt voor een stuk tekst. Stel dat we een tekst hebben waarin 26 letters kunnen voorkomen. De hoeveelheid informatie is maximaal als iedere letter voorkomt met een kans van 1 op 26. Stel dat we een tekst hebben van 100 van die symbolen. Dan is de totale informatie 100 x log2(26) = 470 bits.

Stel nu dat we eenzelfde tekst uit een iets andere bron hebben; de bron heeft nu een voorkeur voor bepaalde symbolen. Stel dat alleen de eerste 13 symbolen in de output van de bron voorkomen. De kans op de andere symbolen is 0. De andere symbolen komen dan voor met een kans 1/13. De informatie van 100 tekens van deze bron is nu I = 100 * - 13 * 1/13 log2 ( 1/13) = 370 bits. We zien nu dat de 100 tekens van de bron minder informatie bevatten. We zouden nu voor ieder symbool niet langer 4.7 bits nodig hebben maar nog slechts 3.7 bits. Er is dus een encodeerschema (bijvoorbeeld Huffmann) dat deze 100 symbolen in 370 bits kan comprimeren.

Wat velen hier in dit topic beweren is iets in de zin van: "Maar als we een tekst opslaan, dan kunnen we de spaties wel weglaten. Het leest moeilijker, maar het is nog wel te begrijpen!" Wat ze hierbij vergeten is dat je een compleet woordenboek mee moet opslaan (okee, jij en ik hebben die al in ons hoofd, maar een computer of ander uitleesapparaat niet!) om de spaties in te voegen op de plekken waar ze zijn weggelaten.

[ Voor 7% gewijzigd door 0rbit op 01-12-2006 14:11 ]

Ik ben geheel voldaan, dank u wel!


  • bszz
  • Registratie: November 2002
  • Laatst online: 14:19
Mr_Atheist schreef op vrijdag 01 december 2006 @ 13:56:
[...]

De hoeveelheid informatie is maximaal als iedere letter voorkomt met een kans van 1 op 26. Stel dat we een tekst hebben van 100 van die symbolen. Dan is de totale informatie 100 x log2(26) = 470 bits.
[...]
Het aantal symbolen dat kan voorkomen is dus bepalend voor de hoeveelheid informatie die kan worden opgeslagen. Ik ben geen expert op dit gebied, maar wellicht kan iemand uitrekenen wat het aantal symbolen moet zijn om de door deze goede man geclaimde 256 GB aan informatie aan informatie te kunnen opslaan (een symbool zou dan volgens mij een compleet A-4tje beslaan). Vervolgens zou je dan kunnen uitrekenen wat het oplossend vermogen van printer en scanner zou moeten zijn om al deze symbolen ook daadwerkelijk op een A-4tje te kunnen weergeven, uitgaande van een binair pixel (zwart/wit). De conclusie zal zijn dat het met de huidige stand van de technologie niet mogelijk is. Uitgaande van het oplossend vermogen dat momenteel wel mogelijk is zou je dan kunnen bepalen hoeveel kleuren je nodig hebt om wel 256GB op te slaan.

Wie helpt even met rekenen......


edit: Ik hou het nog steeds op 51962 dpi als elke pixel een byte van 8 bits zou kunnen vertegenwoordigen, (7 kleuren dus), en 25981 dpi voor een "dual-layer" A-4tje ;)

edit 2: foutje :) gecorrigeerd

[ Voor 28% gewijzigd door bszz op 01-12-2006 20:53 ]


  • 0rbit
  • Registratie: Maart 2000
  • Laatst online: 18-03-2021
bszz schreef op vrijdag 01 december 2006 @ 15:44:
[...]

Ik ben geen expert op dit gebied, maar wellicht kan iemand uitrekenen wat het aantal symbolen moet zijn om de door deze goede man geclaimde 256 GB aan informatie aan informatie te kunnen opslaan (een symbool zou dan volgens mij een compleet A-4tje beslaan). Vervolgens zou je dan kunnen uitrekenen wat het oplossend vermogen van printer en scanner zou moeten zijn om al deze symbolen ook daadwerkelijk op een A-4tje te kunnen weergeven, uitgaande van een binair pixel (zwart/wit). De conclusie zal zijn dat het met de huidige stand van de technologie niet mogelijk is.
Het aantal geclaimde symbolen is in dit geval 256GB. Ofwel 10^9 bytes; ofwel 8*10^9 bits. Mijn berekening kwam uitgaande van een A4 ook uit op apparatuur die met 51.000 dpi moet kunnen scannen en printen.

Stel dat deze Indier niet 256GB netto informatie bedoelde, maar 256GB data voordat de redundantie eruit gehaald is die hij dan gecomprimeerd opslaat dan zou dit volgens mij nooit meer dan een factor 10 kunnen schelen. Dan kom je dus uit op een resolutie van 51.000 / sqrt(10) dpi. Nog steeds een te hoge resolutie voor hedendaagse apparatuur en nog steeds een resolutie die je volgens mij op papier niet betrouwbaar kunt halen. 16.000 dpi is nog steeds meer dan 600 dots per mm.

1200 dpi is zo'n beetje de grens. Als je daarvan uitgaat mis je dus bijna een factor 15. Dat betekent dat je dus 15 keer meer bits in je kleur zou moet verwerken om alsnog op 256GB te komen (let wel: nog steeds met 10 keer compressie, dus 256GB MP3 ofzo kun je alsnog vergeten, want dat is al "gehuffed"); dat zou neerkomen op bijna 40 bits kleurdiepte. Dat zou betekenen dat je meer dan 1000 miljard verschillende kleuren moet kunnen detecteren en schrijven. Dat is een ongekende kleurdiepte voor ALLE bestaande apparatuur voor kleurweergave.

Ik ben geheel voldaan, dank u wel!


  • bszz
  • Registratie: November 2002
  • Laatst online: 14:19
Mr_Atheist schreef op vrijdag 01 december 2006 @ 17:53:
[...]

Dat betekent dat je dus 15 keer meer bits in je kleur zou moet verwerken om alsnog op 256GB te komen (let wel: nog steeds met 10 keer compressie, dus 256GB MP3 ofzo kun je alsnog vergeten, want dat is al "gehuffed"); dat zou neerkomen op bijna 40 bits kleurdiepte. Dat zou betekenen dat je meer dan 1000 miljard verschillende kleuren moet kunnen detecteren en schrijven. Dat is een ongekende kleurdiepte voor ALLE bestaande apparatuur voor kleurweergave.
Thanx, case closed zou ik zeggen. Ik krijg hier iig geen speld tussen 8)

  • wasco
  • Registratie: April 2003
  • Laatst online: 22-12 19:32

wasco

brightest crayon in the box

ahaa, ik heb elders wat verder gelezen en ben er eindelijk uit. een aantal dingen waren hier zo slecht verwoord of verdwenen zodanig in de 'ruis' van het topic, dat ze mij gewoon niet daagden.

i'm with Mr_Atheist

wasco [the brightest crayon in the box]

Pagina: 1 2 Laatste