mboost-dp1
Java: Hjælp til selvhjælp - OCR.
- Forside
- ⟨
- Forum
- ⟨
- Programmering
Hej derude.
Jeg er nået til 4. semester på mit Datamatiker-studie, og vi skal udarbejde en synopsis.
Synopsen skal udfærdiges som selvstudie, og emnet skal ligge uden for pensum.
Jeg havde tænkt at udarbejde et OCR(Læs: Optical Character Recognition) -program, da:
[li]der er god teori i emnet (Så jeg har noget at skrive om i rapporten)[/li]
[li]det kræver at jeg sætter mig en smule ind i Neurale Netværk (Hvis jeg skal kunne oplæres programmet undervejs.)[/li]
[li]jeg kan gå i dybden med det teoretiske bag kendte algoritmer (Så som k-NN - Nearest Neighbor)[/li]
[li]jeg synes det kunne være spændene! :D[/li]
Det er meningen at det endelig produkt skal kunne hente tekst fra billeder.
Der hvor I, kære venner, kommer ind i billedet, er at jeg mangler nogle gode råd, til bøger eller hjemmesider som omhandler emnet.
Eller hvis nogle af Jer derude har nogle erfaringer med emnet er gode råd, eller guidelines også velkommen.
Jeg har ikke arbejdet særlig meget med billeder (JPEG, BMP, etc..) så hele arbejdet med at hente udsnit af hvert enkelt bogstav o0g sammenligne det med et andet udsnit (Hvis jeg vælger at undgå brugen af Neurale Netværk) er lidt svævende for mig. For selv om de 2 udsnit skulle have samme dimensioner, så er der kun 0,00000000001% chance for at de samme bogstaver giver samme bitmønster.
Så råd og vejledning til den del er også velkommen. (Bøger, hjemmesider og lignende.)
På forhånd tak.
Kenn.
Jeg er nået til 4. semester på mit Datamatiker-studie, og vi skal udarbejde en synopsis.
Synopsen skal udfærdiges som selvstudie, og emnet skal ligge uden for pensum.
Jeg havde tænkt at udarbejde et OCR(Læs: Optical Character Recognition) -program, da:
[li]der er god teori i emnet (Så jeg har noget at skrive om i rapporten)[/li]
[li]det kræver at jeg sætter mig en smule ind i Neurale Netværk (Hvis jeg skal kunne oplæres programmet undervejs.)[/li]
[li]jeg kan gå i dybden med det teoretiske bag kendte algoritmer (Så som k-NN - Nearest Neighbor)[/li]
[li]jeg synes det kunne være spændene! :D[/li]
Det er meningen at det endelig produkt skal kunne hente tekst fra billeder.
Der hvor I, kære venner, kommer ind i billedet, er at jeg mangler nogle gode råd, til bøger eller hjemmesider som omhandler emnet.
Eller hvis nogle af Jer derude har nogle erfaringer med emnet er gode råd, eller guidelines også velkommen.
Jeg har ikke arbejdet særlig meget med billeder (JPEG, BMP, etc..) så hele arbejdet med at hente udsnit af hvert enkelt bogstav o0g sammenligne det med et andet udsnit (Hvis jeg vælger at undgå brugen af Neurale Netværk) er lidt svævende for mig. For selv om de 2 udsnit skulle have samme dimensioner, så er der kun 0,00000000001% chance for at de samme bogstaver giver samme bitmønster.
Så råd og vejledning til den del er også velkommen. (Bøger, hjemmesider og lignende.)
På forhånd tak.
Kenn.
tazimn (1) skrev:Jeg har ikke arbejdet særlig meget med billeder (JPEG, BMP, etc..) så hele arbejdet med at hente udsnit af hvert enkelt bogstav o0g sammenligne det med et andet udsnit (Hvis jeg vælger at undgå brugen af Neurale Netværk) er lidt svævende for mig. For selv om de 2 udsnit skulle have samme dimensioner, så er der kun 0,00000000001% chance for at de samme bogstaver giver samme bitmønster.
Jeg kan sige lidt, men jeg ved ikke om det er indlysende eller nyt for dig. ;-)
Først reduceres farvedybden til 1 bit, altså ren sort/hvid. Der er der flere algoritmer til. Fx. en simpel treshold, eller man kan reducere stregtykkelsen til 1 pixel.
Derefter (eller før reducering af farvedyben, faktisk) reduceret opløsningen. Man kan vel sige, at opløsningen helst skal være så lav som mulig, men så man stadig kan se forskel på bogstaverne.
(De gamle palm-pilots med håndskriftsgenkendelse efter et lidt specielt alfabet, reducerede hvert tegn til 3x3 pixels, og kiggede på hvilke pixels man ramte, og i hvilken rækkefølge.)
For et maskinskrevet dokument med én font, kan man nu se, at jo lavere opløsningen er, jo større er sandsynligheden for præcist sammenfald i bitmønstrene.
Det simpleste OCR jeg har set, var baseret på dette. Den lavede en simpel treshold og delte billedet op i bogstaver. For hvert unikke bitmønster, spurgte den brugeren. Så skulle man måske svare "h" 7 gange, men det virkede.
Se evt. den her: (Det meste spændende her sker omkring 1:00 - 1:30)
Well, det var mine 2 øre for denne gang. Jeg kan desværre ikke henvise til nogle gode kilder.
Hvis jeg var jer, ville jeg tage et emne, der var lidt mere tilgængeligt, så det gav jer mere tid til at koncentrere jer om dokumentationen, for det tæller tit mere end selve programmet.
Jeg har set en del OCR frameworks, der har været flere år under udvikling, uden at levere varen godt nok.
Jeg har set en del OCR frameworks, der har været flere år under udvikling, uden at levere varen godt nok.
#3 + #4
På den anden side, når man kan få en lego mindstorm til at gøre det, bare for at lave en sjov sudoku-solver.
Man kunne kigge på hvad han havde af begrænsninger, fx. skal den kun genkende tal. Måske udnytter han også, at han kender fonten. Det kan måske reducere opgaven til noget overkommeligt, men stadig komme omkring den samme teori.
EDIT: Hov, så lige at det er en datamatiker-opgave. Jeg tænkte lige cand eller phd. Det ændrer jo både niveauet og tiden. Tænk grundigt over #3. Måske kan opgaven begrænses til et enkelt trin i processen, hvis det er det der skal til.
På den anden side, når man kan få en lego mindstorm til at gøre det, bare for at lave en sjov sudoku-solver.
Man kunne kigge på hvad han havde af begrænsninger, fx. skal den kun genkende tal. Måske udnytter han også, at han kender fonten. Det kan måske reducere opgaven til noget overkommeligt, men stadig komme omkring den samme teori.
EDIT: Hov, så lige at det er en datamatiker-opgave. Jeg tænkte lige cand eller phd. Det ændrer jo både niveauet og tiden. Tænk grundigt over #3. Måske kan opgaven begrænses til et enkelt trin i processen, hvis det er det der skal til.
myplacedk (5) skrev:På den anden side, når man kan få en lego mindstorm til at gøre det, bare for at lave en sjov sudoku-solver.
Tjoh, men det er noget, der laves af folk, der studerer Matematik/Datalogi, og der er en meget stor portion matematik i OCR. Med al respekt for datamatikere, så har de ikke noget matematisk fag.
#6>> Åhhh hold da op- nogle steder har de et 2 ugers indledende kursus i matematik- det er da rigeligt :p
Jeg takker mange gange for input og kommentarer.
Nu er jeg jo i den heldige situation at synopsen ikke behøver munde ud i et fuldt ud funktionsdygtigt produkt.
Det er vejen dertil og den beskrevne teori som vægter højest.
Og jeg kan endvidere selv definere hvad produktet skal kunne og i hvilket omfang.
Jeg kan høre at en del af Jer synes det er en stor mundfuld.
Det vil jo forenkle mit arbejde hvis jeg kun skal kunne genkende en skrifttype, og kun upper-case bogstaver + tal..
Hvis I andre har nogle forslag til mulige emner er de kærkomne.
Jeg har desuden overejet disse 2 emner:
AJAX
Hibernate
Men jeg har svært ved at se mig ud af det..
Jeg har det bedre hvis jeg har en opgave der skal løses, end at der bare er et emne som AJAX der skal beskrives og illustreres.
Nu er jeg jo i den heldige situation at synopsen ikke behøver munde ud i et fuldt ud funktionsdygtigt produkt.
Det er vejen dertil og den beskrevne teori som vægter højest.
Og jeg kan endvidere selv definere hvad produktet skal kunne og i hvilket omfang.
Jeg kan høre at en del af Jer synes det er en stor mundfuld.
Det vil jo forenkle mit arbejde hvis jeg kun skal kunne genkende en skrifttype, og kun upper-case bogstaver + tal..
Hvis I andre har nogle forslag til mulige emner er de kærkomne.
Jeg har desuden overejet disse 2 emner:
AJAX
Hibernate
Men jeg har svært ved at se mig ud af det..
Jeg har det bedre hvis jeg har en opgave der skal løses, end at der bare er et emne som AJAX der skal beskrives og illustreres.
arne_v (10) skrev:#9
Hvor mange uger har du og hvor mange sider og hvor mange linier kode skal du producere sådan cirka?
Jeg ville ønske at jeg vidste det. Ingen af vores lærere kan svare på det, da der ikke er nogle før os, som har udarbejdet en sådan synopsis, og vores uddannelsesansvarlige kan heller ikke svare os på det.
Det nærmeste vi kommer er at vi har til engang i Maj, og at rapporten ikke må være for stor.
Hvor mange ETCS point det er kan jeg ikke komme i hu nu..
Men det svarer til et valgfag.
Selve mængden af kode har der ikke været noget på tale.
gnarfsan (11) skrev:Hmm vi valgte en teknologi og så et system, der anvendte den. Vi lavede blandt andet et peer to peer chat program til mobil og pc baseret på JXTA og et projektplanlægningssystem med en objektdatabase.
Vær opmærksom på her at dette ikke er hovedopgave, men en individuel selvstillet opgave i stedet for et 3. valgfag, som skal indeholde emner som ligger uden for pensum.
gnarfsan (6) skrev:Tjoh, men det er noget, der laves af folk, der studerer Matematik/Datalogi, og der er en meget stor portion matematik i OCR. Med al respekt for datamatikere, så har de ikke noget matematisk fag.
Brugen af matematik og kvantorer i undervisningen afhænger meget af hvilken lærer man har.
Vores database-underviser er utrolig glad for matematik, og insisterer på at vi udelukkende beskriver teorien ved hjælp af algebra.
Der er mange der skrider i svinget ved sætninger som:
X flerværdi bestemmer Y <=>
∀ t1,t2 Єr hvor t1[x]=t2[x] ∃ t3,t4Єr:t1[x]=t2[x]=t3[x]=t4[x] Λ t1[y]=t2[y]=t3[y]=t4[y] Λ t1[z]=t2[z]=t3[z]=t4[z]
Som beskriver definitionen af Multivalued Dependencies.
Bevares der er ikke komplicerede udregninger, men for folk som ikke forstår logikken i matematikken, er det altså fuldstændig russisk.
til OP.
Jeg ville starte et lidt alternativt sted. phpBB2's CAPTCHA plugin blev brudt for ca. 4 år siden. (dette link er et illustration af udviklingen inden for CAPTCHA http://www.phpbb.com/community/viewtopic.php?f=46&...)
phpBB2's CAPTCHA var ret ordinær, på den led, at algoritmen for at læse tegnene var tæt på som #2 beskrev.
Da den er brudt, skulle det jo være muligt at finde information om de algoritmer der blev brugt, fremgangsmåde o.lign.
Så istedet for at begynde at producere en form for OCR, som er en meget krævende opgave, kunne det måske være en idé at undersøge hvordan man algoritmisk producerer et billede, som kan aflæses af mennesker, som en OCR IKKE umiddelbart kan aflæse.
Jeg ville starte et lidt alternativt sted. phpBB2's CAPTCHA plugin blev brudt for ca. 4 år siden. (dette link er et illustration af udviklingen inden for CAPTCHA http://www.phpbb.com/community/viewtopic.php?f=46&...)
phpBB2's CAPTCHA var ret ordinær, på den led, at algoritmen for at læse tegnene var tæt på som #2 beskrev.
Da den er brudt, skulle det jo være muligt at finde information om de algoritmer der blev brugt, fremgangsmåde o.lign.
Så istedet for at begynde at producere en form for OCR, som er en meget krævende opgave, kunne det måske være en idé at undersøge hvordan man algoritmisk producerer et billede, som kan aflæses af mennesker, som en OCR IKKE umiddelbart kan aflæse.
#13:
Der skal mere kød på matematikken, før den bliver brugbar. Men det er op til dig. Jeg tror bare at du vil blive overrasket over omfanget af opgaven.
Men hvis du skal nå det inden tid, kunne det måske være interessant at lede efter nogle kontrolpunkter, for hvert bogstav. Lave en tabel over hvor, der skal være hvidt, og sort, og placere dem, så de er unikke for hvert bogstav.
En anden men langsom mulighed kunne være at sammenligne med en kontrol font, og se hvor mange procent af punkterne, der matcher. Lav f.eks. en liste over hvor mange procent sort, der er ved hvert bogstav i kontrolfonten, og sammenlign dem først med bogstavet, der skal sammenlignes med. Tag så de nærmeste og lav en pixel for pixel sammenligning. Men skaler og klip først.
Der skal mere kød på matematikken, før den bliver brugbar. Men det er op til dig. Jeg tror bare at du vil blive overrasket over omfanget af opgaven.
Men hvis du skal nå det inden tid, kunne det måske være interessant at lede efter nogle kontrolpunkter, for hvert bogstav. Lave en tabel over hvor, der skal være hvidt, og sort, og placere dem, så de er unikke for hvert bogstav.
En anden men langsom mulighed kunne være at sammenligne med en kontrol font, og se hvor mange procent af punkterne, der matcher. Lav f.eks. en liste over hvor mange procent sort, der er ved hvert bogstav i kontrolfonten, og sammenlign dem først med bogstavet, der skal sammenlignes med. Tag så de nærmeste og lav en pixel for pixel sammenligning. Men skaler og klip først.
tazimn (13) skrev:Vores database-underviser er utrolig glad for matematik, og insisterer på at vi udelukkende beskriver teorien ved hjælp af algebra.
Da jeg havde relationel algebra prøvede jeg at skrive mange af sætningerne med SQL også. Det var meget lærerigt, synes jeg selv.
Jeg lærte at de minder meget om hinanden, men der er forskelle nok til at jeg ikke kan bruge relationel algebra til noget som helst, når jeg skal udforme SQL. Det er nemmere at starte forfra, end at oversætte algebra'en.
Dvs. jo mere jeg lærte om relationel algebra, jo mindre forstod jeg hvorfor min gamle database-lærer absolut skulle snakke så meget om det. Men han synes også selv at det skulle væk fra pensum.
Hvad IT angår tror jeg relationel algebra kun er for DBMS-udviklere, og ikke for brugerne.
Sidespring, sorry.
#1 Det er ok imponerende hvis du gennemfører det omtalte projekt på 4. semester. Vi lavede noget tilsvarende, men dog først på 6. semester og vi var Informatik-ingeniører (matematikkere).
... måske er jeg ved at blive gammel. Jeg har f.eks. heller aldrig set databaser beskrevet via algebra ... damn!
... måske er jeg ved at blive gammel. Jeg har f.eks. heller aldrig set databaser beskrevet via algebra ... damn!
Jeg synes at tråden her har været utrolig givende, med hensyn til input og synspunkter..
Jeg vil gerne dele vores længe ventede oplæg, til synopsen, med Jer..
Der står nogle eksempler som viser nogenlunde hvad de forventer af os, selvom der godt nok er stor forskel på de 2 eksempler..
Hvis det skulle have interesse, kan det læses på : http://docs.google.com/View?id=dc86x87d_42g5wqpgc8
Jeg vil gerne dele vores længe ventede oplæg, til synopsen, med Jer..
Der står nogle eksempler som viser nogenlunde hvad de forventer af os, selvom der godt nok er stor forskel på de 2 eksempler..
Hvis det skulle have interesse, kan det læses på : http://docs.google.com/View?id=dc86x87d_42g5wqpgc8
Syntes dette projekt lyder utrolig interresant, har fulgt med fra sidelinien siden tråden blev startet.
Har ikke nogen interesse i java, men selve problemstillingen med hensyn til OCR har interesse.
Jeg vil derfor gerne høre hvordan projektet skrider frem, samt eventuelle problemstillinger.
Og ellers held og lykke med det.
Har ikke nogen interesse i java, men selve problemstillingen med hensyn til OCR har interesse.
Jeg vil derfor gerne høre hvordan projektet skrider frem, samt eventuelle problemstillinger.
Og ellers held og lykke med det.
Orientering:
Jeg har pr dags dato modtaget bogen:
Introduction to Neural Networks for Java.
Second Edition
ISBN: 9781604390087
Jeg skal aflevere problemformulering på Mandag, så I kan måske regne ud at jeg stædigt holder fast i min første ide..
Så må det briste eller bære.. ;)
Jeg har pr dags dato modtaget bogen:
Introduction to Neural Networks for Java.
Second Edition
ISBN: 9781604390087
Jeg skal aflevere problemformulering på Mandag, så I kan måske regne ud at jeg stædigt holder fast i min første ide..
Så må det briste eller bære.. ;)
#25
Du har nok valgt det forkerte studie hvis du vil arbejde med så komplekse problemstillinger.
Det giver ikke meget mening at uddanne sig som datamatiker, hvis du vil løse opgaver der hører hjemme på datalogi.
Fordi du vil med 99% sandsynelig få en censor som er ligeglad, og fokusere mere på din rapport end din kode og kompleksiteten af din problemstilling, hvis det overhovedet er en opgave som skal vurderes af andre end din lærer.
(Og hvis du ikke får en eksamenskarakter for den, så er det jo spildt arbejde i forhold til det endelige papir).
Og så skal du nok vurdere stærkt hvor meget du faktisk kan nå på den tildelte tid, mens samtidig at gennemføre de andre fag og din hverdag.
Fordi hvis du ender uden et fornuftigt resultat, kan det nemt give bagslag i karakteren, ligegyldig hvor meget du lærer.
Hvad der ikke står på det endelige papir hjælper ingen end dig selv ;)
Du har nok valgt det forkerte studie hvis du vil arbejde med så komplekse problemstillinger.
Det giver ikke meget mening at uddanne sig som datamatiker, hvis du vil løse opgaver der hører hjemme på datalogi.
Fordi du vil med 99% sandsynelig få en censor som er ligeglad, og fokusere mere på din rapport end din kode og kompleksiteten af din problemstilling, hvis det overhovedet er en opgave som skal vurderes af andre end din lærer.
(Og hvis du ikke får en eksamenskarakter for den, så er det jo spildt arbejde i forhold til det endelige papir).
Og så skal du nok vurdere stærkt hvor meget du faktisk kan nå på den tildelte tid, mens samtidig at gennemføre de andre fag og din hverdag.
Fordi hvis du ender uden et fornuftigt resultat, kan det nemt give bagslag i karakteren, ligegyldig hvor meget du lærer.
Hvad der ikke står på det endelige papir hjælper ingen end dig selv ;)
#26
Han er blevet advaret.
Han har truffet sit valg.
Og når man er gammel nok til at gå på datamatiker uddannelsen, så er man også gammel nok til at leve med konsekvenserne af ens valg.
Og hvis man skal anlægge en positiv vinkel: så vil han uden tvivl lære en masse uanset om det går godt eller ej. Og det er vel i sidste ende vigtigere at lære noget end at maksimere karakterere.
Han er blevet advaret.
Han har truffet sit valg.
Og når man er gammel nok til at gå på datamatiker uddannelsen, så er man også gammel nok til at leve med konsekvenserne af ens valg.
Og hvis man skal anlægge en positiv vinkel: så vil han uden tvivl lære en masse uanset om det går godt eller ej. Og det er vel i sidste ende vigtigere at lære noget end at maksimere karakterere.
#27
Det er det, men jeg giver bare lidt udtryk for hvordan lærer/censor behandlede min årgangs 4. semester opgave.
Man bliver nemt skuffet...
Og det endnu værre er at blive straffet i karakteren for noget godt, men ikke fuldendt.
Det er bedre at udsætte de vilde projekter til 5. semester (specialet), og lægge sin energi i der.
En sidste advarsel kan vel aldrig skade ;)
Det er det, men jeg giver bare lidt udtryk for hvordan lærer/censor behandlede min årgangs 4. semester opgave.
Man bliver nemt skuffet...
Og det endnu værre er at blive straffet i karakteren for noget godt, men ikke fuldendt.
Det er bedre at udsætte de vilde projekter til 5. semester (specialet), og lægge sin energi i der.
En sidste advarsel kan vel aldrig skade ;)
Windcape (28) skrev:Det er det, men jeg giver bare lidt udtryk for hvordan lærer/censor behandlede min årgangs 4. semester opgave.
Selve eksamineringen er jo heller ikke specielt fair, memorisering og talegaver har meget med det at gøre.
Her er noget jeg stødte på igår:
"http://blogs.gnome.org/seth/2010/02/23/i-did-the-worst-design-of-my-life-within-gnome/" skrev:True skill is subconscious. Explanations of the results of true skill are invented on the spot for the purposes of communication, they cannot reflect the real ‘reasoning’ that occurred because its not open to conscious reflection.
Det siger egentlig det hele. :)
Anyways, de gange hvor jeg valgte et projekt som jeg vidst ville være "for nemt", har jeg næsten altid haft en følelse af at jeg har spildt min tid. Det er nok en generel følelse datamatiker uddannelsen har efterladt - set tilbage kunne jeg havde udrettet mere. Studiemiljøet var slet ikke til det, men i sidste ende har jeg kun mig selv at bebrejde.
4. semester er i Århus ikke muntlig eksamineringen i programmering, kun i specialeprojekt i Systemudviklingsmetoder.mazing (29) skrev:Selve eksamineringen er jo heller ikke specielt fair, memorisering og talegaver har meget med det at gøre.
(Jeg trak Produkt & Process, samt Foranalyse som bisspørgsmål).
Jeg er enig, man burde have valgt et andet studie.mazing (29) skrev:Det er nok en generel følelse datamatiker uddannelsen har efterladt - set tilbage kunne jeg havde udrettet mere. Studiemiljøet var slet ikke til det, men i sidste ende har jeg kun mig selv at bebrejde.
Problemet er at datamatiker studiet er godt til de process orienterede fag, og meget praktisk, hvor at Datalogi/IT-Ingeniør ikke er det.
Og så er der ikke ligeså mange skøre krav (som Matematik A, hvilket udelukker halvdelen af de gymnasielle uddanelser).
Jeg har nu fået tygget mig igennem bogen, og jeg kan varmt anbefale den til dem, der har interesse inden for emnet.
Bogen er skrevet i et sprog som holder læseren nysgerrig efter mere viden.
Bogen kommer godt omkring flere emner herunder:
Feedforward Netværk med backpropagation
Genetic Algorithm
Simulated Annealing
Pruning
og
Self-Organizing Map.
OCR bliver også nævnt og gennemgået sammen med Self-Organizing Map.
Bogen har dog det kendte amerikaner-syndrom:
Meget af teksten er gentagelser, og eksempelvis er der mange kodeeksempler. Først som hele klasser og dernæst den samme kode splittet op, med uddybende og forklarende tekst.
Nogle steder bliver der endog uddybende forklaret hvordan man programmere i tråde, eller benytter et JPanels paint()-metode.
Men hvis bare man kan abstrahere fra det, er bogen et virkeligt godt redskab til at lære lidt om Neurale Netværk.
Jeg, og min klassekammerat som også har valgt en synopsis som omhandler mønstergenkendelse, nyder godt af at vores underviser i programmering har undervist holdet før os i Neurale Netværk, og vi har derfor kunne skimme 2 andre bøger igennem, som han har stillet til rådighed.
Og hvis man som jeg, ikke er glad for tunge langhårede bøger, er denne helt klart den nemmest tilgængelige..
Den problemformulering vi skulle afgive i Mandags, viste sig ikke at være særlig officiel, idet den skulle bestå af en mail tilsendt vores vejledere hvori vi kort skrev hvad vi havde tænkt os at arbejde med. Den endelige problemformulering skal vi aflevere indenfor en 3 ugers tid.
Dette gav grobund for at vi kunne formulere en meget løs problemformulering, som vi kan skærpe lidt hen ad vejen.
I samarbejde med min underviser har jeg givet vejlederne dette emne jeg ønsker at bearbejde:
Jeg ønsker at lave et program som kan genkende en grafisk repræsentation af tekst ved hjælp af Neurale Netværk.
Med denne formulering er der større arbejdsrum for mig, og mine færdigheder, så jeg kan få gennemgået et emne, og få lavet et produkt inden for den tid vi har tilrådighed.
Jeg takker mange gange for de kommentarer der har været herinde. De har givet mig noget at tænke over.
Til diskussionen omkring at en Datamatiker tager et emne op som burde høre til hos en Datalog:
Jeg synes det er trættende at nogle mennesker sætter andre i bås.
Hvis man ikke bryder sine grænser eller presser sig selv, så udvikler man sig aldrig.
Det er noget vås at en datamatiker ikke skulle kunne klare at udvikle et neuralt netværk som kan genkende mønstre.
I sidste ende afhænger det af interesse.
hvis man kun har interesse for webprogrammering, så er det helt sikkert sværere at sætte sig ind i et emne som ikke har ens interesse.
Jeg har, personligt, ingen interesse inden for webprogrammering når det kommer til design og brugerflader. Desuden er jeg også en nar til at være visuelt kreativ. Derfor har jeg sværere ved at tage mig sammen når vi har webprogrammering. Ikke fordi jsp er svært.. Men fordi jeg ikke gider HTML.. Det er pisse trivielt at skrive tags for at formattere sin skrift. Og det har intet med programmering at gøre..
Nå det var vidst et lille sidespring..
Fortsat god Søndag..!
Bogen er skrevet i et sprog som holder læseren nysgerrig efter mere viden.
Bogen kommer godt omkring flere emner herunder:
Feedforward Netværk med backpropagation
Genetic Algorithm
Simulated Annealing
Pruning
og
Self-Organizing Map.
OCR bliver også nævnt og gennemgået sammen med Self-Organizing Map.
Bogen har dog det kendte amerikaner-syndrom:
Meget af teksten er gentagelser, og eksempelvis er der mange kodeeksempler. Først som hele klasser og dernæst den samme kode splittet op, med uddybende og forklarende tekst.
Nogle steder bliver der endog uddybende forklaret hvordan man programmere i tråde, eller benytter et JPanels paint()-metode.
Men hvis bare man kan abstrahere fra det, er bogen et virkeligt godt redskab til at lære lidt om Neurale Netværk.
Jeg, og min klassekammerat som også har valgt en synopsis som omhandler mønstergenkendelse, nyder godt af at vores underviser i programmering har undervist holdet før os i Neurale Netværk, og vi har derfor kunne skimme 2 andre bøger igennem, som han har stillet til rådighed.
Og hvis man som jeg, ikke er glad for tunge langhårede bøger, er denne helt klart den nemmest tilgængelige..
Den problemformulering vi skulle afgive i Mandags, viste sig ikke at være særlig officiel, idet den skulle bestå af en mail tilsendt vores vejledere hvori vi kort skrev hvad vi havde tænkt os at arbejde med. Den endelige problemformulering skal vi aflevere indenfor en 3 ugers tid.
Dette gav grobund for at vi kunne formulere en meget løs problemformulering, som vi kan skærpe lidt hen ad vejen.
I samarbejde med min underviser har jeg givet vejlederne dette emne jeg ønsker at bearbejde:
Jeg ønsker at lave et program som kan genkende en grafisk repræsentation af tekst ved hjælp af Neurale Netværk.
Med denne formulering er der større arbejdsrum for mig, og mine færdigheder, så jeg kan få gennemgået et emne, og få lavet et produkt inden for den tid vi har tilrådighed.
Jeg takker mange gange for de kommentarer der har været herinde. De har givet mig noget at tænke over.
Til diskussionen omkring at en Datamatiker tager et emne op som burde høre til hos en Datalog:
Jeg synes det er trættende at nogle mennesker sætter andre i bås.
Hvis man ikke bryder sine grænser eller presser sig selv, så udvikler man sig aldrig.
Det er noget vås at en datamatiker ikke skulle kunne klare at udvikle et neuralt netværk som kan genkende mønstre.
I sidste ende afhænger det af interesse.
hvis man kun har interesse for webprogrammering, så er det helt sikkert sværere at sætte sig ind i et emne som ikke har ens interesse.
Jeg har, personligt, ingen interesse inden for webprogrammering når det kommer til design og brugerflader. Desuden er jeg også en nar til at være visuelt kreativ. Derfor har jeg sværere ved at tage mig sammen når vi har webprogrammering. Ikke fordi jsp er svært.. Men fordi jeg ikke gider HTML.. Det er pisse trivielt at skrive tags for at formattere sin skrift. Og det har intet med programmering at gøre..
Nå det var vidst et lille sidespring..
Fortsat god Søndag..!
Interressant...
Syntes det lyder som en rigtig god og spændende opgave. Måske meget omfattende, men som du selv skriver har i kun forumuleret jer løst. Så der er sikkert ikke noget i vejen for eksempelvis kun at genkende tal.
Vil lige sige grunden til jeg gerne ville høre mere, er fordi jeg står over for en problemstilling i forbindelse med en kunde. Hvor OCR muligvis kan være den gyldne løsning.
Men rigtig held og lykke med opgaven, og er da lidt nysgerrig efter om du får hevet nogen kodyle karaktere hjem på den. Om ikke andet er den nok ikke dum at have på sit resumé.
Syntes det lyder som en rigtig god og spændende opgave. Måske meget omfattende, men som du selv skriver har i kun forumuleret jer løst. Så der er sikkert ikke noget i vejen for eksempelvis kun at genkende tal.
Vil lige sige grunden til jeg gerne ville høre mere, er fordi jeg står over for en problemstilling i forbindelse med en kunde. Hvor OCR muligvis kan være den gyldne løsning.
Men rigtig held og lykke med opgaven, og er da lidt nysgerrig efter om du får hevet nogen kodyle karaktere hjem på den. Om ikke andet er den nok ikke dum at have på sit resumé.
Gå til top
Opret dig som bruger i dag
Det er gratis, og du binder dig ikke til noget.
Når du er oprettet som bruger, får du adgang til en lang række af sidens andre muligheder, såsom at udforme siden efter eget ønske og deltage i diskussionerne.