Tagi na forum.

Windows 14206 SQL Server 2132
sieci 6796 Windows XP 1921
SQL 6578 Outlook 1838
SBS 3868 Uprawnienia 1777
Windows 2003 2781 IIS 1636
Windows Server 2588 Office 1516
DNS 2315 Skrypt 1499

pokaż wszystkie tagi na forum

MOSS 2007 jako duże repozytorium dokumentów PDF

robost 2011-05-03 14:33:14
0
avatar
 
 

Obecnie analizuję możliwość zbudowania repozytorium dokumentów PDF na bazie MOSS2007. Żadnego workflow, ani obiegu dokumentów, tylko OCRowanie dokumentów i udostępnienie bibliotek (także do przeszukiwania).

Kwestia o jaką chciałbym zapytać to realność zbudowania takiego rozwiązania przy założeniu, że:
- dokumentów PDF może być nawet milion (!) jednorazowo wrzucone do bibliotek dokumentów i udostępnione przez WWW na zewnątrz;

Farma jaka jest zaproponowana to:
- 1x Web Front Server
- 2x Index Server
- 1x Query Server
- 1x MS SQL Server
- 2x Storage 12TB


Czy jest możliwe zapewnienie sensownej wydajności przy tak potężnej liczbie plików?
Czy ktoś miał już doczynienia z budowaniem podobnego rozwiązania typu Digital Library?
--
tagi: PDF   SQL   web

--

Robert Ostrowicki fromsoft.pl | blog



Pientka  2011-05-03 17:25:19 #1
0
avatar
 
 
Przemyśl użycie SharePoint 2010 i FileStream:
http://sharepoint.microsoft.com/blog/Lists/Posts/Post.aspx?List=72c1c85b-1d2d-4a4a-90de-ca74a7808184&ID=970&Web=fb61b44c-8862-4e1d-875b-898c0ed5f1fc--Pientka.pl || SharePoint Blog

SharePoint 4 Business - usługi SharePoint

SharePointBlog.pl - blog o technologii SharePoint || Office365Blog.pl - blog poświęcony usługom Office 365 

robost  2011-05-04 10:42:48 #2
0
avatar
 
 
Założyłem również dyskusję na Stack Overflow. Może ktoś będzie miał dodatkowe uwagi, za które z góry dziękuję.
wątek w stackoverflow
--
Robert Ostrowicki fromsoft.pl | blog

Edytowano 1 raz. Ostatnio 2011-05-04 10:44:46 przez robost.

--

Robert Ostrowicki fromsoft.pl | blog

Tedman  2011-05-18 09:36:43 #3
0
avatar
 
 
Niedawno w Warszawie było spotkanie społeczności http://www.timeforsharepoint.pl/ a na nim kilka prezentacji. Jedną z nich prowadził Dawid Kozłowski który jest ekspertem w jednej z większych firm Zajmujących się  technologią SharePoint. Z treść prezentacji oraz mojej rozmowy z nim wynikają następujące wnioski:
1. Tworzenie mega-bibliotek z wieloma tysiącami dokumentów ( jakkolwiek technicznie możliwe) jest złym pomysłem , wcześniej czy później system się zapycha i dramatycznie zwalnia. W taki wypadku konieczne jest podzielenie ogromnej ilości na wiele bibliotek np. latami / miesiącami / typami dokumentów itd. Potem  można przy użyciu Serch-a zagregować to w odpowiednich widokach. Z punktu widzenia usera będzie to przezroczyste2. Stosowanie bądź nie obłsugi BLOBów za pomocą EBS/RBS provider zależy od konkretnego przypadku użycia. Założenia Twojego  projektu  wskazują na konieczność jego użycia. Istnieją rozwiązania dla WSS 3.0; MOSS 2007; SPF2010; SPS2010. 
3. Topologia farmy oraz rodzaj użytego sprzętu też ma b.istotne znaczenie.

 
Dodam że u siebie na jednej z farm SPF2010 stosuję EBS do BLOBów . W razie potrzeby mogę podesłać na prix dodatkowe  materiały i kontakt do p Dawida
Podsumowując :


nie tworzyć wielkiego repozytorium w jednej bibliotece; zastosować EBS/RBS ; zastosować activeSearch


W tym konkretnym wypadku keidy  dokumentów PDF może być nawet milion (!) jednorazowo wrzucone do bibliotek dokumentów i udostępnione przez WWW na zewnątrz

realną alternatywą  jest załadowanie ich na filesystem(y) a następnie podłączenie udziałów sieciowych do bibliotek sharepointa. Jest na świecie kilka kompnentów które to potrafią.



Wątek dyskusji w tym temacie http://www.goldenline.pl/forum/2106898/dokumenty-z-sharepointa-na-serwerze-plikow-a-nie-w-sql 

Edytowano 4 razy. Ostatnio 2011-05-18 09:48:32 przez Tedman.
MichalBojko  2011-05-18 11:29:27 #3.1
0
avatar Ekspert WSS
 
 
heh, miło że konferencja została zauważona :)
prezentacja Dawida bedzie w ciagu 2-3 tygodni na w/w stronie konferencji :)--pozdrawiam Michał Bojko
 

pozdrawiam Michał Bojko

www.timeforsharepoint.pl

 

Udziel odpowiedzi

avatar
Treść wpisu:

Zaloguj się lub Zarejestruj się aby wykonać tę czynność.

Idź na górę strony