PHC-Sammyhernz
Forum Veteran
- Joined
- May 5, 2016
- Posts
- 1,479
- Reaction
- 734
- Points
- 522
sana nga boss may tumulong,Wait mo lang mga willing tumulong ts, di na kailangan ng payment (bawal trading/buy and sell) free lahat dito.
Web crawling din pinagawa sa inyo?Gumawa ka sa blogger ng website tapos copy XML and e paste mo nalang sa c++ mo. Wala naman maraming tanong yung instructor ko tinignan lang nya design ng website ko then I passed.
boss ano ba requirements at paano mag start sa web crawling please notice meCrawling ba or scraping? Kapag crawling Illist lang lahat ng links/URL ng website kapag web scrapping May kukuhain na data.
You do not have permission to view the full content of this post. Log in or register now.
php xpath po last time ung gamit ko pang web scraping.
gumawa ako ng bot para ma kuha lahat ng details ng lahat ng phone ng isang brand sa gsm arena.
so depende po sir sa purpose ng crawler ang gagawin nyu.
yung samin po kasi boss all about emergency response so bali yung gagawin namin pag nag search ng location bali lalabas lahat ng emergency response na malapit sa search mong location. so bali boss yung keyword namin is location.You do not have permission to view the full content of this post. Log in or register now.
php xpath po last time ung gamit ko pang web scraping.
gumawa ako ng bot para ma kuha lahat ng details ng lahat ng phone ng isang brand sa gsm arena.
so depende po sir sa purpose ng crawler ang gagawin nyu.
sir hindi po web crawler ung kailangan nyu, data miner po,mostly wala naman pong websites ang mga emergency response group, meaning manually nyu pong hanaping at eh encode sa database ang locations ng bawat emergency responders.yung samin po kasi boss all about emergency response so bali yung gagawin namin pag nag search ng location bali lalabas lahat ng emergency response na malapit sa search mong location. so bali boss yung keyword namin is location.
ano ba kaibahan ng web crawler sa data mining boss, ang sabi kasi ng prof. namin web crawling daw gagawa kami ng portal na all about emergency response, so lahat ng government agency na may emergency response kukunin namin yung location nun tapos yung hotline number, para pag nag search sa search bar lalabas lahat ng emergency response na malapit sa na search mong location, so kapag sunog ang nangyari malapit sa inyo pipiliin mo yung fire station hotline number at yun ang tatawagan mo, kasi naka display na dun yung lahat ng emergency response pipiliin mo nalang yung dapat rumespundi sa inyo.sir hindi po web crawler ung kailangan nyu, data miner po,mostly wala naman pong websites ang mga emergency response group, meaning manually nyu pong hanaping at eh encode sa database ang locations ng bawat emergency responders.
sir ung web crawler is for web indexing para po sa mga search engine like google, data mining is collecting data for database and machine use.ano ba kaibahan ng web crawler sa data mining boss, ang sabi kasi ng prof. namin web crawling daw gagawa kami ng portal na all about emergency response, so lahat ng government agency na may emergency response kukunin namin yung location nun tapos yung hotline number, para pag nag search sa search bar lalabas lahat ng emergency response na malapit sa na search mong location, so kapag sunog ang nangyari malapit sa inyo pipiliin mo yung fire station hotline number at yun ang tatawagan mo, kasi naka display na dun yung lahat ng emergency response pipiliin mo nalang yung dapat rumespundi sa inyo.
yun nga sana gusto namin boss kaso sabi prof. namin dapat daw yung galing sa internet so wala kaming database na gagamitin boss pag nag search kami sa internet sya maghahanap,sir ung web crawler is for web indexing para po sa mga search engine like google, data mining is collecting data for database and machine use.
so kung gusto mong eh crawl ang web for emergency phone numbers, pano mo ma lalaman kng active pa ang phone? or accurate ung data na kinukuha ng crawler?
madali lng naman sir ung thesis nyu, kilangan nyu lng eh collect lahat ng emergency responders at details nila then lagay sa database at gumawa ng script para mag output ng search result sa query ng use.
example pag may data sa kayu:
sql query - SELECT * FROM database WHERE location = $input;
ang magiging output po ay lahat ng responders sa location na nilagay ng user.
ah then sir ito kilangan nyu You do not have permission to view the full content of this post. Log in or register now.yun nga sana gusto namin boss kaso sabi prof. namin dapat daw yung galing sa internet so wala kaming database na gagamitin boss pag nag search kami sa internet sya maghahanap,
salamat madami boss, pwede ba boss maka request kung ano po mga gagamitin para maka create ng web crawler, may na search kasi ako boss kailangan daw ng spider tool para sa crawling.ah then sir ito kilangan nyu You do not have permission to view the full content of this post. Log in or register now.
d2 ka po kukuha ng links para sa crawler You do not have permission to view the full content of this post. Log in or register now.
then code mo lng po ung algorithm para sa search levels, example pag may nakitang link na hindi listed sa previous 1000 links ay lalagay din sa indexed sites.
first search level mo ung 1000 list
second search level is ung sites na nasa loob ng 1000 list
then third level and so on.
basically gagawa ka ng sarili mong search engine.
suggestion ko po is sa malakas na PC ka mag run ng first indexing mo, para hindi mag hang at ma wala lahat ng indexed sites mo. then weekly mag index ka ulit ng sites baka may bagong update.
pag naka index ka na ng site, gumawa ka ng search engine na mag hahanap ng websites na may hotline ng emergency responders sa indexed sites mo.
P.S.:
naka dependi ang indexing speed sa internet at PC mo, ung crawler sa tutorial is single thread lng, pwede mong eh modify for multi-threading para mas mabilis ung indexing, basta malakas lng PC at internet mo.
sana maka tulong, good luck sir, naka gawa ako ng crawler kaso ung data na hinahanap ko is nasa isang site lng, ung sa inyu eh buong WWW kng pwede po kayo maka hanap ng advice sa naka gawa na mas mabuti.
salamat madami boss, pwede ba boss maka request kung ano po mga gagamitin para maka create ng web crawler, may na search kasi ako boss kailangan daw ng spider tool para sa crawling.
$file_handle = fopen("urllist.txt", "r");
while (!feof($file_handle))
{
$url = trim(fgets($file_handle));
$content = file_get_contents($url);
$document = array($url,$content);
$serialized = serialize($document);
$fp = fopen('./documents/'.md5($url), 'w');
fwrite($fp, $serialized); fclose($fp);
}
fclose($file_handle);
so dapat boss mag cre create kami ng urllist niyan?php sir,
PHP:$file_handle = fopen("urllist.txt", "r"); while (!feof($file_handle)) { $url = trim(fgets($file_handle)); $content = file_get_contents($url); $document = array($url,$content); $serialized = serialize($document); $fp = fopen('./documents/'.md5($url), 'w'); fwrite($fp, $serialized); fclose($fp); } fclose($file_handle);
yan lng po ang code ng crawler, eh open ng crawler lahat ng sites sa urllist.txt then sasave nya lahat ng content sa txt file. single thread at 1 level lng po yan, kilangan mong eh modify para maging multi threaded.
yes sir,so dapat boss mag cre create kami ng urllist niyan?
boss ano pa yung ma i papayo nyosa web crawling yung mga tips at tut or any na makakahelp boss super appreciatedyes sir,
We use cookies and similar technologies for the following purposes:
Do you accept cookies and these technologies?
We use cookies and similar technologies for the following purposes:
Do you accept cookies and these technologies?