File talk:Average prokaryote cell- en.svg

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search

Multilingual version

[edit]

I copied File:Average prokaryote cell- de.svg (which had text rather than curves courtesy Mrmw) and added English text to it. Use SVG Translate to add new translations.

Glrx (talk) 01:06, 15 November 2022 (UTC)[reply]

sprachen

[edit]

hi, was ist special:diff/547887176/547899578? stell mir ständig vor wie praktisch es wäre, mehrsprachige svgs automatisch zu erstellen, im code wiki-data-module zu platzieren, die den erforderlichen text suche, das ganze wrapped man dann noch in eine regeln fürs textlayout und alle können es nutzen, nur ein traum ... --Mrmw (talk) 15:16, 20 January 2022 (UTC)[reply]

das sieht wirklich interessant aus, ich untersuche das mal weiter -- sarang사랑 10:50, 22 January 2022 (UTC)[reply]
@Mrmw: Sehr verzögert komme ich darauf zurück. SVG-Renderer können das nicht, und werden es sicher auch nie können.
Möglich ist jedoch eine weitgehend automatisierte Vorgehensweise, etwa derart dass eine Datei erstellt wird mit den jeweiligen Texten in zB deutsch oder sonst einer Sprache. Dann werden alle Zielsprachen festgelegt, und von einem Übersetzungstool werden von jedem Urspungstext alle Zieltexte erstellt. Dann braucht es noch ein tool das die notwendigen SVG-Parameter hinzufügt, und diese Textblöcke werden in den SVG-Code eingefũgt.
Da es in verschiedenen Sprachen sehr unterschiedliche Wortlängen gibt muss oft noch manuell angepasst werden. Aber Übersetzungstools gibt es, Google oder Deepl etc., und es ist vermutlich machbar sie zur Mitarbeit zu bewegen.
Ein deutlicher Nachteil jeder maschinellen Übersetzung ist dass da oft was missverstanden wird, und gelegentlich totaler Unsinn rauskommt. Das Ergebnis muss immer kontrolliert und überwacht werden, was wiederum humane Arbeit erfordert.
In der Wikimedia gibt es meist zu Dateien mit Text zahllose weitere Dateien - für jede Sprache eine eigene.... Da ist ein sehr breites Feld für Aufräumarbeiten ! -- sarang사랑 13:32, 3 November 2022 (UTC)[reply]

multi-lang-file

[edit]

Scheme ant worker anatomy-de.svg
hi, ich hab mal wieder ein beschriftetes svg überarbeitet und vor allem den text gesäubert
per hand jetzt ein multi-lang-file zu erstellen ist mir zu viel arbeit offen gestanden, werde es nicht tun
siehst du den aufwand in relation zum nutzen? würdest hier jetzt die anderen sprachen einpflegen? gruß --Mrmw (talk) 23:10, 12 November 2022 (UTC)[reply]

@Mrmw:
LadyofHats does fantastic work.
Your version is great. It is clean, and it uses the appropriate start, middle, and end text anchors. Bravo.
Glrx (talk) 06:59, 13 November 2022 (UTC)[reply]
@Mrmw and Glrx: It does not look too difficult, and when all national versions use text enbeding, I will compose an international version - as an example for such expansions! Just wait.
Now I gave the resources a look: there are 12 files with text - only the CN is pathed; RU text can be extraxted from the numbered version.
I will need some hours of composition, then we will have it.
BTW, I never used Inkscape to create an SVG. I would like to convert e.g. Emblem Friedenstaube but all the guides/manuals/tutorials tell quite a lot about special features of drawing new images but I did not find anything how to convert easily a raster image (this lack may be the reason why so many fakes exist?). -- sarang사랑 07:15, 13 November 2022 (UTC)[reply]
my english is not the yellow from the egg! its nice if you create a multilang-file for the ants-image, but i dont need a guide for this, its too time-consuming for myself, so i dont want to do it, also not for other files
did I understand you correctly? you dont want to convert this pigeon in svg, you want to create a guide in commons to enable other to do this?
i am not a high-end-lvl-user of inkscape, but i think i am able to convert this png
in my opinion there are to different ways for converting
1 use the tool/gadget 'trace bitmap' in inkscape
in this case you have to choose a proper method like 'brightness cutoff', 'edge detection', 'color quantization', ... and adjust proper parameters for choosen method
although this step is not easy, its also difficult to process the result which means to seperate and to clean svg-pathes resulting from this gadget
2 trace the bitmap manually
in this case you create/draw paths as straigth segments or as bezier-path
this method also requires practice and experience
since both methods are complex and require experience, there are probably no instructions for them yet --Mrmw (talk) 10:54, 13 November 2022 (UTC)[reply]

Du darfst auch deutsch mit mir! Und Glrx kann es ausreichend um mitzulesen, falls er will. Es gibt alo keine einfache Methode der Konvertierung? Schade, aber wenn es so diffizil ist will ich mich nicht damit belasten - "too time-consuming for myself"! Wenn du so nett bist sowas zu machen, bin ich dir dankbar, aber ist nicht so extrem wichtig. Falls du es machst gib mir bitte dann einen ping. -- sarang사랑 11:08, 13 November 2022 (UTC)[reply]

Emblem of the Friedensrat der DDR.svg
hier bitte, um auf deutsch nochmals für klarheit zu sorgen - ich erstelle gern auch mit mehr zeitaufwand neue svgs, sei es durch tracen/abzeichnen (s. taube) oder neu erstellen
ich überarbeite auch gerne bestehende svgs (s. ameise)
ich tue mich allerdings schwer damit, viel aufwand in die realisierung von multi-lang-files zu investieren, ich finde es gut wenn man nur ein svg für alle sprachen benutzen kann, aber zum einen weiss ich nicht wo die zukunft hingeht in sachen multi-lang-files, zum anderen ist mir einfach die gefahr zu groß, dass mit wenigen klicks unbedarfter user in einschlägigen übersetzungstools die arbeit wieder dahin ist
wenn du dir die mühe machst finde ich das gut, gern können wir hier arbeitsteilung machen
an dem ameisen-file in sachen mulitlang mache ich nichts --Mrmw (talk) 12:36, 13 November 2022 (UTC)[reply]
wenn du files zum konvertieren hast, die dir am herzen liegen, dann kannst du mir gern bescheid geben --Mrmw (talk) 12:37, 13 November 2022 (UTC)[reply]

"mit wenigen klicks unbedarfter user...": auf vorversionen kann immer zurückgegriffen werden; und ich habe ein script um den tool-ballast zu entfernen, so dass die neue übersetzung ohne den müll wirksam wird. leider wird das {{NoInkscape}} meist ignoriert.
ja, die taube hätte ich gerne, um am SVG weiterzumachen. vorschlag: du brauchst es nicht hochzuladen, kannst auch mir den code als source schicken - hier, als mail, oder auf der taubenseite. -- sarang사랑 12:48, 13 November 2022 (UTC)[reply]

du hast den link übersehen? --Mrmw (talk) 12:54, 13 November 2022 (UTC)[reply]
ja, glatt übersehen! aber wenn ich so drauf gestossen werde: danke fur die convertierung -- sarang사랑 13:01, 13 November 2022 (UTC)[reply]

Converting to a switch-translated multilingual file is simple: just use SVG Translate. The ugly part of the conversion happens if the existing text elements have a lot of attributes because SVG Translate will slavishly copy those attributes. Mrmw's SVG for LadyofHats ant image would work very well. The text elements look like

   <g text-anchor="end">
    <text x="125.01684" y="422">Mandibeln</text>
    <text x="124.62328" y="389">Clypeus</text>
    ...                                         very accurat placement on 0.00001 pixel
   </g>

SVG Translate will copy all the coordinates. It will also wrap the text content with a tspan element and add id attributes. Not pretty, and sort of pointless. I wish SVG Translate would not add tspan elements when they are not present. There's a technical reason that SVG Translate uses id attributes, but I wish it would delete the identifiers it added. SVG Translate also does not have a good theory about the SVG default language.

The only optimization that I do for multilingual files is move the coordinates to a switch element:

   <g text-anchor="end">
    <switch transform="translate(125.01684 422)"><text>Mandibeln</text></switch>
    <switch transform="translate(124.62328 389)"><text>Clypeus</text></switch>
    ...
   </g>

I used to group elements with a g element to apply similar formatting (such as the font-size="12"). I tend to avoid that practice now. Instead, I will add a class attribute and put the desired CSS formatting in a style element. The problem with grouping elements for formatting is that it imposes a strange structure on the diagram. I would rather group a text element with its leader line element. That structure makes some sense.

Using switch translations offers some benefits, but it also imposes costs. Most graphics applications will no longer be able to edit the file. Inkscape can edit the file, but there are still problems. Editors using Inkscape may inadvertently insert graphics elements inside of switch stranslations. They may copy text and inadvertently introduce bad translations. It has gotten to the point that we discourage novice editors from using Inkscape on File:2022 Russian invasion of Ukraine.svg.

Glrx (talk) 18:00, 13 November 2022 (UTC)[reply]

@Glrx: ist aktuell jemand von euch dran das ant-file in multilang zu transformieren oder plant dies zu tun?
mir ist nicht ganz klar welche struktur glrx im code für den mehrsprachigen text anstrebt
welches tool zum übersetzen meint glrx?
ich habe zwei weitere files soweit überarbeitet, dass man auch hier multilang erstellen könnte
ich frage mich allerdings wie man es machen sollte, also von welchem file aus man startet, welches file zum multilangfile werden soll?
das de-file? oder das en-file, das vermutlich bereits am häufigsten eingebunden ist? oder sollte man ein neues file erstellen und dieses 'multilang' nennen?
ich möchte eigentlich keine arbeit abgeben, die ich selbst nicht machen möchte - aber dennoch die frage: soll ich potentielle multilang-files hier listen? hast du interesse daran aus gesäuberten starter-files multilang-versionen zu erstellen?
--Mrmw (talk) 22:07, 14 November 2022 (UTC)[reply]
Your ant file is the best starting point. It has some minor differences (e.g., the rectangles and additional text), but they are not significant changes to the original. Furthermore, someone has already made the -en version multilingual. Consequently, I would add the translations from the -en version to your version and overwrite the -en version with that file. Then more translations may be easily added to the -en version. (I could also ask to rename the -en version to have no suffix, but that is a small point.)
For other files such as Average prokaryote cell, I would also want to fix the root of the version tree rather than some minor branch. Given that the German version has converted the curves to text, I would reinsert the English and overwrite the English version. I would also adjust text positions to make sure there is room for larger words (such as translations of Pili). I would adjust the leader line starting positions to be more consistent.
The translation tool is Commons:SVG Translate tool. Here's a link for your file
https://svgtranslate.toolforge.org/File:Scheme_ant_worker_anatomy-de.svg
Many SVG files can be converted to multilingual files by just running SVG Translate on the file. The result will be usable, but if the graphic artist did not choose sensible anchor points, the text alignments will be ragged.
When you set fonts, use a fallback to a CSS generic font. That is, instead of font-family="FreeSans", use font-family="FreeSans, sans-serif" (or just use sans-serif).
I will look at the Average SVG.
Glrx (talk) 00:08, 15 November 2022 (UTC)[reply]
File:Average prokaryote cell- en.svg is now multilingual based on your - de version. Glrx (talk) 01:14, 15 November 2022 (UTC)[reply]
Thank you @Glrx: it is a good work! And thanx for all your useful hints. One question (I am ignorant on prokaryotes): where from comes the mystic "Speicherstoff" ? AFAIK it is not existent in any other drawing. -- sarang사랑 05:43, 15 November 2022 (UTC)[reply]
It was in the -de.svg, so I left it. I did not find a satisfactory description of the component. Glrx (talk) 16:54, 15 November 2022 (UTC)[reply]
Seems that it was an idea of NEUROtiker who does not contribute since August 2015 - no chance to ask him about.
Might be the best one to remove it? -- sarang사랑 17:22, 15 November 2022 (UTC)[reply]
Maybe it should go. I kept it because I found Reservestoff (Q2145617). However, there are few translations and only 2 Wiki articles. Glrx (talk) 17:37, 15 November 2022 (UTC)[reply]
@Glrx:
Average prokaryote cell- en.svg
i removed it and added other langs --Mrmw (talk) 15:23, 16 November 2022 (UTC)[reply]
gibt es eine möglichkeit/vorlage multilang-files sichtbarer/auffälliger zu gestalten bzw. zu markieren? --Mrmw (talk) 15:25, 16 November 2022 (UTC)[reply]
Very nice. I will make a slight tweak when I get back; SVG Translate wants all elements of a switch to have the same structure.
I've wondered how to advertise multilingual files. For example, the file is used on several wikis, and it might be good to ask those wiki users to add a translation for their language.
Glrx (talk) 20:39, 16 November 2022 (UTC)[reply]
@Glrx:
ich habe nochmals eine datei hochgeladen weil ich eine gute quelle für übersetzungen gefunden habe:
c:special:globalusage/Average prokaryote cell numbered.svg
jedes mal wenn ich so ein multilang-projekt mache (obwohl ich immer aknündige es nicht mehr machen zu wollen) frage ich mich ob dieser aufwand wirklich lohnt und muss an all die files denken, denen man die selbe behandlung zukommen lassen könnte/müsste
user für übersetzungen anzuschreiben finde ich ein bisschen heftig, ich würde die files an sich lieber per vorlage kennzeichnen und in eine kategorie einordnen
p.s.: dieser rdf-block erzeugt einen fehler beim validieren des svgs --Mrmw (talk) 21:12, 16 November 2022 (UTC)[reply]
@Glrx:
hier die globale verwendung des ru-files
c:special:globalusage/Average prokaryote cell- ru.svg
da in dem multilangfile ru enthalten ist, würde ich gern das einsprachige ru-file durch das multilangfile ersetzen
für ru-projekte besteht hier keine frage
aber es gibt andersprachige projekte, die offenbar gut mit ru leben können
ich könnte bei bxr auf bxr:Амидарал zwar mit lang=ru bei der einbindung arbeiten, dann würde aber ohne änderung bei der einbindung immer ru gerendert werden, selbst wenn dem file bxr hinzugefügt wurde
leider scheinen hier keine fallbacks zu greifen, dass auch ohne angabe der sprache bei der einbindung auf die nächste fallback-ebene gewechselt wird (keine ahnung ob das ru in dem falle von brx ist)
diese schilderung ist exemplarisch - des öfteren werden einsprachige files is einigen wenigen ähnlichsprachigen projekten verwendet --Mrmw (talk) 21:48, 16 November 2022 (UTC)[reply]
andere files für das oben beschriebene:
--Mrmw (talk) 22:11, 16 November 2022 (UTC)[reply]
sorry für spaming, aber das thema multilang-files ist einfach komplex meiner meinung nach:
der user hier wünscht sich eine andere schriftart für sein wiki-projekt:
bn:ব্যবহারকারী_আলাপ:আফতাবুজ্জামান#কোষ_(জীববিজ্ঞান)
--Mrmw (talk) 22:21, 16 November 2022 (UTC)[reply]
@Mrmw:
Global file usage is an indicator of files to fix or to translate, and I like the lists that identify which convert-to-SVG bitmap files are included on the most pages. Sadly, the indication is often misleading. The file may be used in a common but esoteric template. More significantly, it does not identify the files that are the most viewed. One file may be included in 100 obscure articles that are seldom viewed. Another image may be included in only 10 articles, but each of those articles may get 10,000 views per month. The latter file should probably get more attention.
Even images that do not get many views may be reasonable translation targets. For example, images that address high school subjects such as File:Conic Sections.svg.
Yes, there are complex problems with translation.
IIRC, WMF had a plan for SVG language fallbacks, but I do not know if anything came of it. Cyrillic languages falling back to Russian makes some sense.
There is a CSS fix for bn font selection:
text:lang(bn), text[systemLanguage|="bn" i] {font-family:Noto Sans Bengali, sans-serif;}
However, WMF's rasterizer (librsvg) does not implement language or attribute selectors. Adding the CSS should not hurt and will give a better display when the SVG is opened. I would not set the font-family on individual Bengali text elements. That could confuse SVG Translate and graphics programs that do simple copies of existing text.
I have not seen the "Text run is not in Unicode Normalization Form C" SVG error in years.
Glrx (talk) 04:20, 17 November 2022 (UTC)[reply]
konkrete frage speziell an @Sarang:
  • hast du eine meinung dazu, wie und in welche wiki-sprach-projekte so ein multilangfile eingebunden werden sollte bzw. wo nicht? s. dazu meine global-usage-links oben, bei denen gut zu sehen ist, dass ein bestimmtes lang-file in verschiedenen sprachen eingebunden ist, und das für die sprachen offenbar ok ist, diese sprachen jedoch oft nicht explizit im multi-lang-file abgebildet sind - versuche nochmals die problematik zu schildern: binde ich das mulitlangfile mit nl enthalten auch in pap ein, erscheint dort nicht nl sondern default, also en - binde ich das multilangfile mit sprachcode nl ein, wird es dort für immer so bleiben und immer nl anzeigen, selbst wenn pap als sprache dem multilangfile hinzugefügt wurde
  • kann/sollte man multilangfiles nicht besser visualisieren? ich denke, wenn es sichtbarer wäre, würden mehr user diese files benutzen und wohl auch häufiger sprachen ergänzen
--Mrmw (talk) 12:55, 19 November 2022 (UTC)[reply]
  • @Mrmw: diese logok der sprach-defaults habe ich mal in der wikipedia graphisch dargestellt gesehen — ich schau mal, ob ich das wieder finde, es waren hinweise dabei wie damit umzugehen ist.
  • ich fürchte, wer schon immer dateien vervielfältigt hat wird bei dieser methode bleiben - jede ǘbersetzung eine neue datei.
die neue multilang-datei soll natürlich in alle naionalen prokariotenartikel eingebunden werden, das geht schnell. und macht die einzeldateien obsolet.
sprachen ergänzen ist so eine sache - es sollten zuerst alle sprachen gesammelt und dann erst die datei hochgeladen werden, und auch später nicht jedesmal ein upload sondern wenn einiges zuammegekommen ist. ich finde es sehr übel wenn irgendwelche leute mit dem kaputten tool übersetzen und den ganzen tspan ballast etc. nicht entfernen.
ich habe noch ein klein wenig rumgemacht, ganz vorsichtig. texte auf hunderstel und tausenstel pixel genau zu platzieren ist unsinn, meist sind mehrere pixel egal.
immer daselbe wort in den verschiednen sprachen neu zu schreiben ist redundant, siehe <text systemLanguage="de,en,es,fr,gv,it,ms,nl,ro">Pili</text>.
meine bereinigung hat auch die überflüssige erste tspan-klammerung bei den nukloiden entfernt.

die letzten wochen war ich sehr beschäftigt mit IgenCoa, erst jetzt habe ich wieder mehr luft -- sarang사랑 14:55, 19 November 2022 (UTC)[reply]