&gt;i think it is key that we can mark strings as translatable without<br>&gt;making the html invalid.<br>agreed!<br><br>&gt;I like the idea of picking up certain tags by default like title, meta<br>
&gt;tags, and then picking up h1, h2, etc. unless they have the lang=&quot;&quot;<br>
&gt;attribute specified. <br>so, in this way we can have specific language text independent of the current localization.<br>mm, interesting.<br> <br>in order to dice what to use, I&#39;ll play with both,<br>it will be useful for &quot;counting up 10&quot; activity :)<br>
<br>felipe<br><div class="gmail_quote">2009/7/2 Bryan Berry <span dir="ltr">&lt;<a href="mailto:bryan@olenepal.org">bryan@olenepal.org</a>&gt;</span><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
i think it is key that we can mark strings as translatable without<br>
making the html invalid.<br>
<br>
I like the idea of picking up certain tags by default like title, meta<br>
tags, and then picking up h1, h2, etc. unless they have the lang=&quot;&quot;<br>
attribute specified.  Then it would be nice to pick up everything else<br>
that belongs to the class=&quot;translate&quot;. What u think?<br>
<br>
I am looking thru src of html2po and it appears that the primary fault<br>
is that it uses the horrible HTMLParser.py   <a href="http://webunit.HTMLParser.py" target="_blank">webunit.HTMLParser.py</a><br>
instead of  something more sane like lxml or beautiful soup<br>
<br>
it may be easier to swap out HTMLParser for lxml than improve html2po on<br>
top of HTMLParser<br>
<br>
I will play w/ lxml and html2po to see what i can work out.<br>
<br>
re: beautiful soup vs. lxml . My heart is w/ lxml, enjoyed working w/ it<br>
before and seems to have better css selectors than beautiful soup.<br>
<br>
tks again for your help sayamindu!<br>
<div><div></div><div class="h5"><br>
On Thu, 2009-07-02 at 16:54 +0530, Sayamindu Dasgupta wrote:<br>
&gt; I did a little tweaking of html2po to get <a href="http://pastebin.be/19509" target="_blank">http://pastebin.be/19509</a><br>
&gt; The label tags need to be fixed - but apart from that I think the rest<br>
&gt; of that is OK. May be we can try and build upon html2po and see how it<br>
&gt; works out.<br>
&gt; Thanks,<br>
&gt; Sayamindu<br>
&gt;<br>
&gt; 2009/7/2 Bryan Berry &lt;<a href="mailto:bryan@olenepal.org">bryan@olenepal.org</a>&gt;:<br>
&gt; &gt; subzero,<br>
&gt; &gt;<br>
&gt; &gt; i have been having a lot of discussions about i18n w/ the ever patient<br>
&gt; &gt; sayamindu and reading a lot on the subject. However, I haven&#39;t<br>
&gt; &gt; accomplished much.  Here is my current playground<br>
&gt; &gt;<br>
&gt; &gt; <a href="http://karma.sugarlabs.org/yes_no/" target="_blank">http://karma.sugarlabs.org/yes_no/</a><br>
&gt; &gt;<br>
&gt; &gt; am currently wrangling how to generate a meaningful po file from an html<br>
&gt; &gt; page.<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; --<br>
&gt; &gt; Bryan W. Berry<br>
&gt; &gt; Technology Director<br>
&gt; &gt; OLE Nepal, <a href="http://www.olenepal.org" target="_blank">http://www.olenepal.org</a><br>
&gt; &gt;<br>
&gt; &gt; _______________________________________________<br>
&gt; &gt; Sugar-devel mailing list<br>
&gt; &gt; <a href="mailto:Sugar-devel@lists.sugarlabs.org">Sugar-devel@lists.sugarlabs.org</a><br>
&gt; &gt; <a href="http://lists.sugarlabs.org/listinfo/sugar-devel" target="_blank">http://lists.sugarlabs.org/listinfo/sugar-devel</a><br>
&gt; &gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
--<br>
Bryan W. Berry<br>
Technology Director<br>
OLE Nepal, <a href="http://www.olenepal.org" target="_blank">http://www.olenepal.org</a><br>
<br>
</div></div></blockquote></div><br>