[Python-checkins] python/nondist/sandbox/setuptools/setuptools package_index.py, 1.1, 1.2

Tue Jun 14 03:26:29 CEST 2005

Update of /cvsroot/python/python/nondist/sandbox/setuptools/setuptools
In directory sc8-pr-cvs1.sourceforge.net:/tmp/cvs-serv4594/setuptools

Modified Files:
	package_index.py 
Log Message:
Add lots of progress messages, so people know what the package search is
doing.


Index: package_index.py
===================================================================
RCS file: /cvsroot/python/python/nondist/sandbox/setuptools/setuptools/package_index.py,v
retrieving revision 1.1
retrieving revision 1.2
diff -u -d -r1.1 -r1.2

--- package_index.py	12 Jun 2005 03:44:07 -0000	1.1
+++ package_index.py	14 Jun 2005 01:26:26 -0000	1.2
@@ -90,21 +90,21 @@
         self.fetched_urls = {}
         self.package_pages = {}
 
-    def scan_url(self, url):
-        self.process_url(url, True)
-
     def process_url(self, url, retrieve=False):
         if url in self.scanned_urls and not retrieve:
             return
 
         self.scanned_urls[url] = True
         dists = list(distros_for_url(url))
-        map(self.add, dists)
+        if dists: self.debug("Found link: %s", url)
 
-        if dists or not retrieve or url in self.fetched_urls:
+        if dists or not retrieve or url in self.fetched_urls:           
+            for dist in dists:
+                self.add(dist)
             # don't need the actual page
             return
 
+        self.info("Reading %s", url)
         f = self.open_url(url)
         self.fetched_urls[url] = self.fetched_urls[f.url] = True
         if 'html' not in f.headers['content-type'].lower():
@@ -121,17 +121,11 @@
                 link = urlparse.urljoin(base, match.group(1))
                 self.process_url(link)
 
-    def find_packages(self,requirement):
-        self.scan_url(self.index_url + requirement.distname)
-        if not self.package_pages.get(requirement.key):
-            # We couldn't find the target package, so search the index page too
-            self.scan_url(self.index_url)
-        for url in self.package_pages.get(requirement.key,()):
-            # scan each page that might be related to the desired package
-            self.scan_url(url)
-
     def process_index(self,url,page):
+        """Process the contents of a PyPI page"""
+        
         def scan(link):
+            # Process a URL to see if it's for a package page
             if link.startswith(self.index_url):
                 parts = map(
                     urllib2.unquote, link[len(self.index_url):].split('/')
@@ -141,10 +135,12 @@
                     pkg = safe_name(parts[0])
                     ver = safe_version(parts[1])
                     self.package_pages.setdefault(pkg.lower(),{})[link] = True
+
         if url==self.index_url or 'Index of Packages</title>' in page:
             # process an index page into the package-page index
             for match in HREF.finditer(page):
                 scan( urlparse.urljoin(url, match.group(1)) )
+
         else:
             scan(url)   # ensure this page is in the page index
             # process individual package page
@@ -156,11 +152,56 @@
                         # Process the found URL
                         self.scan_url(urlparse.urljoin(url, match.group(1)))
 
+
+
+
+
+
+
+
+
+
+
+    def find_packages(self,requirement):
+        self.scan_url(self.index_url + requirement.distname+'/')
+        if not self.package_pages.get(requirement.key):
+            # We couldn't find the target package, so search the index page too
+            self.warn(
+                "Couldn't find index page for %r (maybe misspelled?)",
+                requirement.distname
+            )
+            if self.index_url not in self.fetched_urls:
+                self.warn(
+                    "Scanning index of all packages (this may take a while)"
+                )
+            self.scan_url(self.index_url)
+
+        for url in self.package_pages.get(requirement.key,()):
+            # scan each page that might be related to the desired package
+            self.scan_url(url)
+
     def obtain(self,requirement):
         self.find_packages(requirement)
         for dist in self.get(requirement.key, ()):
             if dist in requirement:
                 return dist
+            self.debug("%s does not match %s", requirement, dist)                
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
 
     def download(self, spec, tmpdir):
         """Locate and/or download `spec`, returning a local filename
@@ -193,19 +234,21 @@
                         "Not a URL, existing file, or requirement spec: %r" %
                         (spec,)
                     )
-
         # process a Requirement
+        self.info("Searching for %s", spec)
         dist = self.best_match(spec,[])
         if dist is not None:
+            self.info("Best match: %s", dist)
             return self.download(dist.path, tmpdir)
 
+        self.warn("No local packages or download links found for %s", spec)
         return None
 
-
-
     dl_blocksize = 8192
 
     def _download_to(self, url, filename):
+        self.info("Downloading %s", url)
+
         # Download the file
         fp, tfp = None, None
         try:
@@ -242,8 +285,6 @@
     def reporthook(self, url, filename, blocknum, blksize, size):
         pass    # no-op
 
-
-
     def open_url(self, url):
         try:
             return urllib2.urlopen(url)
@@ -278,8 +319,8 @@
             else:
                 return filename
 
-
-
+    def scan_url(self, url):
+        self.process_url(url, True)
 
 
 
@@ -313,22 +354,24 @@
 
 
     def _download_svn(self, url, filename):
+        self.info("Doing subversion checkout from %s to %s", url, filename)
         os.system("svn checkout -q %s %s" % (url, filename))
         return filename
 
+    def debug(self, msg, *args):
+        pass #print msg % args    # XXX
 
-
-
-
-
-
-
-
-
+    def info(self, msg, *args):
+        print msg % args    # XXX
+        
+    def warn(self, msg, *args):
+        print msg % args    # XXX
 
     def _download_sourceforge(self, source_url, sf_page, tmpdir):
         """Download package from randomly-selected SourceForge mirror"""
 
+        self.debug("Processing SourceForge mirror page")
+
         mirror_regex = re.compile(r'HREF=(/.*?\?use_mirror=[^>]*)')
         urls = [m.group(1) for m in mirror_regex.finditer(sf_page)]
         if not urls:
@@ -338,6 +381,12 @@
 
         import random
         url = urlparse.urljoin(source_url, random.choice(urls))
+
+        self.info(
+            "Requesting redirect to (randomly selected) %r mirror",
+            url.split('=',1)[-1]
+        )
+
         f = self.open_url(url)
         match = re.search(
             r'<META HTTP-EQUIV="refresh" content=".*?URL=(.*?)"',
@@ -359,11 +408,3 @@
 
 
 
-
-
-
-
-
-
-
-