Hmm, then you is better use the OPDS service?<br>One of the problems in the OPDS server is we don't have the links to<br>the DejaVu files.<br>I am not very impressed with Internet Archive implementations.<br>The languages are not stored in standard ways, the information about the <br>
formats of the files is not clear, etc. And I did not found a email to contact the developers.<br>If you want help me testing what is the best way to request the books,<br>you can change in the find_books method:<br><br>            if self.source == 'Internet Archive':<br>
                self.queryresults = \<br>                        opds.InternetArchiveQueryResult(search_text,<br>                        query_language, self)<br>            elif self.source in _SOURCES_CONFIG:<br><br>to <br>
            """<br>            if self.source == 'Internet Archive':<br>
                self.queryresults = \<br>
                        opds.InternetArchiveQueryResult(search_text,<br>
                        query_language, self)<br>
            elif self.source in _SOURCES_CONFIG:<br>

            """<br>            if self.source in _SOURCES_CONFIG:<br>

<br>
and Internet Archive will use OPDS interface again.<br><br><br><br><br><br><div class="gmail_quote">On Sat, Apr 2, 2011 at 11:00 AM, James Simmons <span dir="ltr"><<a href="mailto:nicestep@gmail.com">nicestep@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">Gonzalo,<br>
<br>
I haven't tried out your Activity yet but I do want to warn you about<br>
one thing.  The RESTful service from IA does not give you the file<br>
name of the book, just it's identifier.  Now for MOST books in the<br>
Archive you can derive the file name from the identifier, but that<br>
isn't true for all of them.  For Community Books (those uploaded by<br>
outsiders) the filename can be quite different and the REST API<br>
doesn't give you a way to know what it is.<br>
<br>
For some examples of this, do a search for the word "nicestep" in the<br>
archive and you'll see all the community texts I've donated myself.<br>
You'll see a couple of issues:<br>
<br>
1).  Filenames that don't match the identifier + a suffix.<br>
2).  Filenames that DO match, but are not what you want.  For example,<br>
<br>
<a href="http://www.archive.org/details/TheContinentsAndTheirPeopleOceania" target="_blank">http://www.archive.org/details/TheContinentsAndTheirPeopleOceania</a><br>
<br>
If you try to download the PDF using the filename that GIAB uses<br>
you'll get a 203 megabyte monster!  The one you want is called<br>
<br>
TheContinentsAndTheirPeopleOceania_text.pdf<br>
<br>
and is only 4 megabytes.  It also includes searchable text, which the<br>
monster does not!<br>
<br>
OPDS is supported by IA (I think they helped to develop it) and should<br>
probably be used for all searches.  We can leave GIAB around until it<br>
has outlived it's usefulness.<br>
<font color="#888888"><br>
James Simmons<br>
</font><div><div></div><div class="h5"><br>
<br>
On Fri, Apr 1, 2011 at 11:01 PM, Gonzalo Odiard <<a href="mailto:gonzalo@laptop.org">gonzalo@laptop.org</a>> wrote:<br>
> Here there are a new unofficial version of GetBooks to test.<br>
> You can download it from <a href="http://dev.laptop.org/%7Egonzalo/GetBooks-6.xo" target="_blank">http://dev.laptop.org/~gonzalo/GetBooks-6.xo</a> (the<br>
> name of the file is the same, but is updated)<br>
> New improvements:<br>
> * Don't save entry in the Journal.<br>
> * Download cover images in separated threads to do the UI more responsive.<br>
> * Use REST client backend to search in Internet Archive (from Get Internet<br>
> Archive Books activity)<br>
> * Show books in the journal (My books, in the sources combo)<br>
> * Improved work flow (using "Open in Journal" buttons, like in Browse)<br>
> * Add support of DejaVu files.<br>
> * More minor fixes<br>
><br>
> You can see the code (and start to contribute ;) ) in<br>
> <a href="http://git.sugarlabs.org/%7Egodiard/get-books/gonzalo-mainline" target="_blank">http://git.sugarlabs.org/~godiard/get-books/gonzalo-mainline</a><br>
><br>
> If you want test adding a private bookserver, you can install Pathagar<br>
> <a href="http://en.flossmanuals.net/e-book-enlightenment/ch026_the-pathagar-book-server" target="_blank">http://en.flossmanuals.net/e-book-enlightenment/ch026_the-pathagar-book-server</a><br>
> and copy the file get-books.cfg from the activity to /etc directory and add<br>
> a section:<br>
><br>
> [MyBookServer]<br>
> name = MyBookServer<br>
> query_uri = <a href="http://IP_NUMBER/catalogs/?q=" target="_blank">http://IP_NUMBER/catalogs/?q=</a><br>
> opds_cover = <a href="http://opds-spec.org/cover" target="_blank">http://opds-spec.org/cover</a><br>
><br>
> Gonzalo<br>
><br>
><br>
</div></div></blockquote></div><br>