Tiny Search Engine

Eddie Bae (GitHub username: 20eddibae)

This repository implements the three components of CS50’s Tiny Search Engine:

crawler — web crawler that pulls pages from a seed URL
indexer — builds an inverted index from the crawled pages
querier — answers search queries against the index

Prerequisites

A UNIX‐compatible shell (macOS / Linux)
make, gcc, standard build tools
Internet connection (for crawling)

Build

From the top‐level directory:

# build libcs50 and all three tools
make all

Usage

Crawl

# <pagedir> must not exist or be empty
./crawler/crawler <seedURL> <pagedir> <maxDepth>

Indexer

mkdir indexdir
./indexer/indexer pages indexdir

Example:

./crawler/crawler http://cs50tse.cs.dartmouth.edu/tse/letters pages 2

Querier

./querier/querier indexdir

Clean

make clean

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
common		common
crawler		crawler
indexer		indexer
libcs50		libcs50
output		output
querier		querier
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Tiny Search Engine

Eddie Bae (GitHub username: 20eddibae)

Prerequisites

Build

Usage

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

20eddibae/WebCrawler

Folders and files

Latest commit

History

Repository files navigation

Tiny Search Engine

Eddie Bae (GitHub username: 20eddibae)

Prerequisites

Build

Usage

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages