Toon posts:

[ALG] Pagina's overzetten naar Database *

Pagina: 1
Acties:

Verwijderd

Topicstarter
Ik heb een 2 kleine issues waar ik niet helemaal uit kom.

1:
Er zijn een aantal html pagina's met daarop text en screenshots die naar een database gemoved moeten worden. Dit zodat deze makkelijker kunnen worden geupdate en dat er een full text search overheen gehaald kan worden.
Dit alles moet in een MSSQL2000 database komen die met behulp van java/jsp/etc gaat worden uitgelezen en word terug gekoppeld aan de client.

De screenshots ben ik van plan om gewoon in een subfolder op de BEA Weblogic server te dumpen en daarin aan te refereren in de sourcecode.
Echter weet ik nou niet echt wat handig is om te doen.

Of:
De complete html pagina in de database mikken.
(krijg je dan geen HTML code terug bij een search?)
Of
Alleen de plain tekst de database in en de rest via JSP's uitwerken.
(How to?, ben nog niet goed thuis in 't gebruik van TAGS met ATTRIBUTES).

2:
Ook zijn er een aantal Word documenten waarvan de inhoud de database in zal moeten of als word document direct op de BEA Weblogic server terecht komen. Echter wanneer ik een Word document open via http://blabalb/test.doc krijg ik de plain code weer van het document, ipv dat Word word gestart. Dit ligt denk ik aan de Weblogic server 6.1 omdat het vanaf een IIS server wel werkt, maar die moet dus gaan verdwijnen. En omzetten naar PDF/HTML/whatever is niet in alle gevallen mogelijk.

  • djluc
  • Registratie: Oktober 2002
  • Laatst online: 24-05 13:32
2: check de headers.

1: je kunt kijken of je geen CMS kunt gebruiken wat al mogelijkheden heeft tot het importeren van bepaalde gegevens. Dat lijkt mij het meest eenvoudige. Als dit er niet is zou je het document moeten parsen en de afbeeldingen e.d. moeten kopiëren. Hoe zie je dat editten precies voor je? Is het geen idee om gewoon een CMS te installeren en vervolgens de bestanden om te zetten zodat het CM deze begrijpt?

[ Voor 122% gewijzigd door djluc op 07-07-2004 13:38 ]


Verwijderd

Topicstarter
1:
Een CMS is een idee, maar dan moet ik dat ook zelf schrijven. Aangezien dit een project voor mij is om Java, etc onder de knie te krijgen. Een CMS moet er ook uiteindelijk wel komen zodat ik niet alles met SQL admin o.i.d. hoef te doen/in te voeren. Maar om het van de grond te krijgen zal ik toch eerst dit moeten uitdenken/voor elkaar zien te krijgen.

En het editten is meer zoiets van stukje tekst in een veldje plakken. Op submit klikken en daarmee toevoegen aan de database. 't staat dan wel al direct in de goede layout.
En wat bedoel je precies met parsen?

2: welke headers? 't is gewoon een link naar 't document.

  • Eärendil
  • Registratie: Februari 2002
  • Laatst online: 00:05
De HTTP-headers, daar staat in wat het content-type is dat verzonden wordt; dat is nu waarschijnlijk text/plain, het moet application/msword zijn voor Word-documenten

[ Voor 3% gewijzigd door Eärendil op 07-07-2004 15:17 ]


Verwijderd

Topicstarter
Ok, maar hoe kan ik dat dan vertellen aan mijn webserver?
Ik heb al eens een javascript geprobeerd:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
<script language="JavaScript">
  function startWord(strFile)
  {
    var myApp = new ActiveXObject("Word.Application");
    if (myApp != null)
    {
      myApp.Visible = true;
      myApp.Documents.Open(strFile);
    }
  }
</script>

<a href="javascript:startWord('http://yoursite/test.doc')">Test.doc</a>.


Maar die wilde niet.

Verwijderd

Full text search wordt echt helemaal naar van opmaakcode in je content, ik heb dit opgelost door 2 velden aan te maken, namelijk een datastripped, en een data.

In datastripped staat alle content, ontdaan van opmaakcode, en in data de originele content. Datastripped word puur door full text search geindexeerd, en data voor gebruik op de frontend.

Dmv. wat trucjes met text fields in MS SQL 2000 is dit nog snel te krijgen ook zoals:

code:
1
2
3
4
5
6
EXEC sp_tableoption 'Content', 'text in row', 'ON'
GO
UPDATE Content
SET Data = C.Data,
DataStripped = C.DataStripped
FROM Content C

[ Voor 27% gewijzigd door Verwijderd op 07-07-2004 15:53 ]

Pagina: 1