Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум на CrossPlatform.RU _ Переводы _ статистика перевода

Автор: Litkevich Yuriy 6.8.2008, 4:12

Вообщем воткнул я в OmegaT все файлы Qt 4.3.2 (оригинальные html'ьники)
получил такую статистику:
Общее число сегментов: 411043
Уникальные сегменты: 188795

затем добавил ту ПП которую выкладывал на форуме и получил дополнительную статистику:
Переведённые уникальные сегменты: 2306

и того переведено: 1,94%

:hang1:

Автор: ViGOur 6.8.2008, 9:11

Фигня, перенести в OmegaT уже переведенные фрагменты и заметно легче станет. ;)

Автор: Litkevich Yuriy 6.8.2008, 12:46

я попробывал в лоб, грязную ПП (ту что alex977 сделал) не скушала омега, надо чистить по прикидкам alex977 там должно быть около 9 тыс. уникальных сегментов, итого: ~5,98 %

Автор: ViGOur 6.8.2008, 15:03

Я что-то помнится пробовал делать c tmx файлами вроде съедал, поже попробую вогнать описание классов в него...

Автор: Novak 12.11.2008, 22:23

Статистика на данный момент, по окончанию перегона переводов в tmx файлы:
Общее число сегментов: 410448
Уникальные сегменты: 188783
Переведённые уникальные сегменты: 17932
Переведено примерно 9.5%

Автор: Litkevich Yuriy 13.11.2008, 1:24

нормально, можно предположить, что столько же процентов уже переведено в Qt 4.3.5, Qt 4.4.0 и Qt 4.4.3 :)

Автор: ViGOur 13.11.2008, 8:32

Цитата(Litkevich Yuriy @ 13.11.2008, 1:24) *
нормально, можно предположить, что столько же процентов уже переведено в Qt 4.3.5, Qt 4.4.0 и Qt 4.4.3 :)
Угу, думаю +-1%

Автор: Litkevich Yuriy 14.11.2008, 18:03

статистика по Qt 4.4.3:
уникальных сегментов - 212'016
переведено - 16'438
итого - 7,75%

Автор: alex977 14.11.2008, 18:16

Это с учетом кода примеров или без?

Автор: Novak 14.11.2008, 18:23

Это вроде всё, что есть. С учётом кода примеров из руководств и т.д.

Автор: Litkevich Yuriy 14.11.2008, 19:25

100% html'ов

к слову сказать троли во многих местах добавили по в водному слову, соответсвенно полного совпадения стало мало, только нечеткие - ручками надо, но всеравно, представте себе на секунду жизнь без OmegaT, мыбы эти 7% месяца 3-4 бы делали.

Автор: alex977 20.11.2008, 11:27

Раз уж все увлеклись статистикой, то вот и мои 5 копеек ;-)

статистика по qtdoc4.4.3-en:

      =========
    Тип             |кол-во файлов  | размер файлов | кол-во сегментов  | кол-во уникальных сегментов
1. без категории    | 356 (13%)     | 5,9 Мб        | 62 897 сег.       |  41 873 сег. (22%)
2. описание класса  |1056 (40%)     |17,2 Мб        |161 693 сег.       | 107 769 сег. (56,5%)
3. примеры и демо   | 194 ( 7%)     | 2,1 Мб        | 28 409 сег.       |  19 775 сег. (10%)
4. список членов    | 842 (32%)     |10,2 Мб        | 93 846 сег.       |  15 460 сег. ( 8%)
5. уст. чл. класса  |  73 ( 2,7%)   |   289 кб      |  2 188 сег.       |   1 211 сег. ( 0,6%)
6. поддержка qt3    | 133 ( 5%)     |   872 кб      |  7 488 сег.       |   4 689 сег. ( 2,5%)
ИТОГО:              |2654           |               |356 521 сег.       | 190 777 сег.
7. исх.коды и т.п.  |1287           | 6,6 Мб        |120 746 сег.       |  40 793 сег.
ВСЕГО:              |3941           |               |477 267 сег.       | 231 570 сег.
    =========



маска файлов для 4 пункта:
*-members.*

маска файлов для 7 пункта: *-cpp.*;*-h.*;*-js.*;*-qrc.*;*-pro.*;*-xq.*;*-ui.*;*-xml.*;*-qhp.*;*-qhcp.*;*-svg.*

Файлы из 7 пункта можно вообще не переводить (разве что заголовки и комментарии, где есть).
Файлы из 4 пункта очень похожи - заголовок и 1 сегмент (и то, и другое общее для всех файлов, разница лишь в названии класса).

Цитата
List of All Members for <имя класса>

This is the complete list of members for <имя класса>, including inherited members.


P.S. В сообщении можно создавать таблицу?

Автор: Litkevich Yuriy 20.11.2008, 12:54

Цитата(alex977 @ 20.11.2008, 14:27) *
P.S. В сообщении можно создавать таблицу?
разве что ручным форматированием и в тэге код :(

Автор: Novak 12.1.2009, 19:45

Пока сухая статистика на данный момент:
Общее число сегменов: 467 511
Число уникальных сегментов: 212 016
Переведено уникальных сегментов: 22 994 (чуть больше 10,8%)

http://ifolder.ru/9993922 которые прогнал через OmegaT. То есть там как полностью, так и частично переведённые с помесью русского и английского.

Автор: ViGOur 13.1.2009, 8:55

За чем на ифолдер если это вроде как Юра уже делает на ассембле откуда она и берется для исходной документации в http://doc.crossplatform.ru/qt или я что-то не так понял?

Автор: Litkevich Yuriy 13.1.2009, 11:48

Novak, я сделал http://trac.assembla.com/qt4rtt на ассембле, чтобы под ногами в основном не путалось и туда складирую то, что Омега перевела. А Эдик забирает, с помощью программы.

Автор: Novak 13.1.2009, 18:22

Просто на всякий случай, Омеге если не выделить много оперативы, то она не сможет все файлы осилить.
И в архиве вообще все файлы, а не только переведённые.

Автор: Novak 8.2.2009, 11:05

Февраль 2009:
Общее число сегменов: 467 511
Число уникальных сегментов: 212 016
Переведено уникальных сегментов: 25 001 (почти 11,8%)

Автор: Novak 8.3.2009, 21:44

Март 2009:
Общее число сегменов: 467 511
Число уникальных сегментов: 212 016
Переведено уникальных сегментов: 26 649 (~12,57%)

Автор: Litkevich Yuriy 28.3.2009, 17:00

тут http://www.forum.crossplatform.ru/index.php?showuser=523, решил проверить/перевести все файлы исходников примеров, т.е. с именами типа *-{h|cpp}.html.
А я взял да посчитал, что если он их все обработает, то получится, что у нас 42% документации переведено!

:cool2: :good:

Автор: Kagami 28.3.2009, 17:22

А еще pro, xml, js, qrc, ui и xq. Всего 1207 файлов получилось :)

Кстати, сегодня заглянул в project_save.tmx - там в конце около 10 фраз переведено с русского на русский. Интересно почему? Думаю их стоит при ближайшем слиянии удалить

Автор: Litkevich Yuriy 28.3.2009, 18:03

Цитата(Kagami @ 28.3.2009, 20:22) *
Интересно почему? Думаю их стоит при ближайшем слиянии удалить
затисалось откуда-то, видимо при создании ПП из имеющегося перевода. Думаю Novak возьмёт на заметку.

Цитата(Kagami @ 28.3.2009, 20:22) *
Всего 1207 файлов получилось
я как раз их и посчитал, те что у тебя в source лежат.

Автор: Novak 29.3.2009, 1:21

Цитата(Litkevich Yuriy @ 28.3.2009, 17:00) *
то получится, что у нас 42% документации переведено!

Вряд.. я считаю проценты по переводу уникальных сегментов. А по объёму могут быть совсем другие цифры.. Или ты тоже по сегментам считал?

Автор: Litkevich Yuriy 29.3.2009, 4:31

Цитата(Novak @ 29.3.2009, 5:21) *
Или ты тоже по сегментам считал?
нет я как раз по файлам.
По сегментам, цифра существенно меньше.

Зато есть чем похвастаться :)

Автор: Novak 30.3.2009, 7:30

Получаются тогда дутые цифры)

Автор: Kagami 30.3.2009, 10:53

Всего уникальных сегментов - 212 016. В исходных кодах - 40 793. Перевод исходных кодов даст 19.24% Не так много как хотелось бы :(

Автор: Litkevich Yuriy 30.3.2009, 11:01

Нестоит растраиваться, главное то, что процесс в движении.

Автор: Kagami 30.3.2009, 12:14

По состоянию на март было переведено 12,57%. Если прибавить 19,24% получается 31,81% Чуть ниже чем грубый расчет по файлам, но все равно не плохо

P.S. Правда не знаю, успею ли добить их до конца недели

Автор: Litkevich Yuriy 30.3.2009, 12:17

Цитата(Kagami @ 30.3.2009, 16:14) *
P.S. Правда не знаю, успею ли добить их до конца недели
спешить не надо, надо хорошо сделать.

Автор: Novak 6.5.2009, 7:59

Май 2009:
Общее число сегменов: 467 511
Число уникальных сегментов: 212 015
Переведено уникальных сегментов: 68 736 (~32,42%)
(благодаря включению исходников)

Автор: Litkevich Yuriy 6.5.2009, 10:11

Приятные новости, и отставание от процента по файлам уже не так велико.

Автор: Novak 6.5.2009, 12:19

Дальше будет сложнее, т.е. скорость будет прежней, таких скачков скорее всего не будет. Но всё равно, приятно)

Автор: Novak 7.6.2009, 11:11

Июнь 2009:
Общее число сегменов: 467 511
Число уникальных сегментов: 212 015
Переведено уникальных сегментов: 69 937 (~32,99%)

Автор: Litkevich Yuriy 13.6.2009, 1:56

по Qt 4 Snapshot: переведено уникальных сегментов 26,6%

Автор: Litkevich Yuriy 23.6.2009, 9:27

По Qt 4.4.3, как бы точная :)

Analyse Total (3746 files):

Match Types  Segments        Words Percent Placeables
Context TM          0            0       0          0
Repetitions   142,496      520,579      20    265,080
100%          187,657      715,511      27          0
95% - 99%       1,264        6,425       0        613
85% - 94%       3,346       25,589       1      2,893
75% - 84%           0            0       0          0
50% - 74%           0            0       0          0
No Match      158,555    1,389,685      52    368,211
Total         493,318    2,657,789     100    636,797

Chars/Word        6.47
Chars Total 17,197,209
как получил см. http://www.forum.crossplatform.ru/index.php?showtopic=620&view=findpost&p=21152

Общее число сегментов отличается от показаний Омеги, по причине того, что я лоханулся при заливке исходных файлов в хранилище. Оно несодержит файлы относящиеся к Макам и Иксам, т.е. взято из архива ***windows***, а не ***all*** (исправлять в SVN'е до перехода на новую версию документации нет смысла). На сайте, в том числе для загрузки используются правильные комплекты.

Автор: Novak 12.7.2009, 10:57

Июль 2009:
Общее число сегменов: 467 511
Число уникальных сегментов: 212 015
Переведено уникальных сегментов: 73 774 (~34,71%)

Автор: Litkevich Yuriy 13.7.2009, 3:34

Статистика для Qt 4.x (Snapshot от 2009.06.11)
Общее число сегменов: 549 062
Число уникальных сегментов: 235 135
Переведено уникальных сегментов: 65 819 (~28%)

Автор: Novak 4.8.2009, 7:01

Август 2009:
Общее число сегменов: 460 040
Число уникальных сегментов: 212 014
Переведено уникальных сегментов: 75 240 (~35,48%)

P.S. Что-то у меня странное с количеством сегментов..

Автор: Litkevich Yuriy 4.8.2009, 13:07

Цитата(Novak @ 4.8.2009, 11:01) *
P.S. Что-то у меня странное с количеством сегментов..
да, надобы разобратся, почему их меньше стало.

Автор: Litkevich Yuriy 6.8.2009, 19:45

вроде со статистикой всё путём, Novak, может ты в этот раз ты другие файлы использовал?

Автор: Novak 6.9.2009, 13:22

Сентябрь 2009

Заменил файлики, которые обычно перевожу в тестовом проекте для проверки общего файла, на документацию из 2009.01 - вот что получил:
Общее число сегменов: 497 467
Число уникальных сегментов: 227 264
Переведено уникальных сегментов: 71 667 (~31,53%)
Если брать по тем, что есть у нас в репозитории:
Общее число сегменов: 497 467
Число уникальных сегментов: 212 014
Переведено уникальных сегментов: 76 306 (~35,99%)

Есть предложение пока ориентироваться на то, что есть в репозитории.
Потом, после перевода большей части, просто будем смотреть наиболее свежую версию доков от нокии.

Автор: Litkevich Yuriy 6.9.2009, 13:28

Цитата(Novak @ 6.9.2009, 17:22) *
из 2009.01
а это что за документация?

Цитата(Novak @ 6.9.2009, 17:22) *
Потом, после перевода большей части, просто будем смотреть наиболее свежую версию доков от нокии.
скоро 4.6 выйдет, т.к. http://doc.trolltech.com/4.6-snapshot/index.html, а master'е уже 4.7 помечено.

Автор: Novak 6.9.2009, 13:30

как вариант можно основные версии скидывать в папку с сорцами, количество уникальных сегментов всё равно будет нашим ориентиром.

Автор: Litkevich Yuriy 9.9.2009, 14:17

Цитата(Litkevich Yuriy @ 6.9.2009, 17:28) *
скоро 4.6 выйдет
http://labs.trolltech.com/blogs/2009/09/09/qt-460-tech-preview-1/

Автор: Novak 9.9.2009, 19:00

Цитата(Litkevich Yuriy @ 6.9.2009, 14:28) *
Цитата(Novak @ 6.9.2009, 17:22) *
из 2009.01
а это что за документация?

4.5.0.0 походу, я просто указал версию Qt SDK, что была под рукой на компе.

Автор: Novak 5.10.2009, 11:35

Октябрь 2009

4.5.0.0:
Общее число сегменов: 497 467
Число уникальных сегментов: 227 264
Переведено уникальных сегментов: 85 377 (~37,57%)

Из репозитория:
Общее число сегменов: 460 040
Число уникальных сегментов: 212 014
Переведено уникальных сегментов: 90 849 (~42,85%)

Вместе:
Общее число сегменов: 957 507
Число уникальных сегментов: 236 848
Переведено уникальных сегментов: 90 956 (~38,40%)

Автор: Novak 5.10.2009, 20:15

Ок, с сентября я именно правки себе в отдельный файл заношу. В августе могли быть косяки, постараюсь за этот год сделать tmx-файл исправлений.

Автор: Novak 16.11.2009, 10:10

Ноябрь 2009
Общее число сегменов: 957 507
Число уникальных сегментов: 236 848
Переведено уникальных сегментов: 92 426 (~39,02%)

Автор: Litkevich Yuriy 16.11.2009, 16:30

Цитата(Novak @ 16.11.2009, 13:10) *
(~39,02%)
это значит Qt 4.4 + новое из Qt 4.5 ?

Автор: Novak 17.11.2009, 1:53

Цитата(Litkevich Yuriy @ 16.11.2009, 16:30) *
Цитата(Novak @ 16.11.2009, 13:10) *
(~39,02%)
это значит Qt 4.4 + новое из Qt 4.5 ?

Да. Просто там есть ряд сегментов, которые различны для разных версий, я теперь включаю файлы из обоих версий в тестовый проект

Автор: Novak 7.12.2009, 7:41

Декабрь 2009
Общее число сегментов: 957 507
Число уникальных сегментов: 236 848
Переведено уникальных сегментов: 92 800 (~39,18%)

Автор: Litkevich Yuriy 18.4.2010, 19:38

Апрель 2010
--- Qt 4.4 ---
Общее число сегментов: 469 166
Число уникальных сегментов: 212 417
Переведено уникальных сегментов: 100 431 (~47,28%)
По файлам: ~66%


--- Qt 4.6 ---
Общее число сегментов: 592 266
Число уникальных сегментов: 251 421
Переведено уникальных сегментов: 107 212 (~42,64%)
По файлам: ~54%

Автор: Litkevich Yuriy 5.7.2010, 0:17

Июль 2010
--- Qt 4.4 ---
Общее число сегментов: 472 914
Число уникальных сегментов: 210 811
Переведено уникальных сегментов: 102 291 (~48,5%)
По файлам: ~67%

--- Qt 4.5 ---
Общее число сегментов: 519 316
Число уникальных сегментов: 229 270
Переведено уникальных сегментов: 109 816 (~48%)
По файлам: ~ 57.6%

--- Qt 4.6 ---
Общее число сегментов: 596 816
Число уникальных сегментов: 249 488
Переведено уникальных сегментов: 120 116 (~48%)
По файлам: ~ 65.8%

Автор: Litkevich Yuriy 20.9.2010, 5:56

Август 2010
--- Qt 4.3 ---
Переведено уникальных сегментов: ~47%
По файлам: ~38%

--- Qt 4.4 ---
Переведено уникальных сегментов: ~48%
По файлам: ~67%

--- Qt 4.5 ---
Переведено уникальных сегментов: ~48%
По файлам: ~ 57%

--- Qt 4.6 ---
Переведено уникальных сегментов: ~48,5%
По файлам: ~ 66%

Автор: Litkevich Yuriy 18.11.2010, 21:24

Ноябрь 2010
--- Qt 4.3 ---
Переведено уникальных сегментов: ~47%
По файлам: ~38%

--- Qt 4.4 ---
Переведено уникальных сегментов: ~48,84%
По файлам: ~67,21%

--- Qt 4.5 ---
Переведено уникальных сегментов: ~48,27%
По файлам: ~ 57,88%

--- Qt 4.6 ---
Переведено уникальных сегментов: ~48,63%
По файлам: ~ 66,71%

--- Qt 4.7 ---
Переведено уникальных сегментов: ~40,88%
По файлам: ~ 15,24%

Автор: iReset 20.7.2012, 8:21

Сделал список не переведённых файлов по состоянию на 07 июля 2012 года.
Может, кому-то будет интересно.

UPD: обновлённый список в следующем посте.

Автор: iReset 23.7.2012, 9:32

Приношу свои извинения - http://www.forum.crossplatform.ru/index.php?showtopic=1029&view=findpost&p=59425 версия списка была сгенерирована с ошибкой, из-за которой по некоторым файлам было указано не максимальное количество сегментов, а меньшее значение. На списке файлов, списке версий и метке эта ошибка не отражается. Выложил обновлённую версию списка.

 qtrtt_translate_info.zip ( 42.64 килобайт ) : 3
 

Автор: iReset 5.10.2012, 11:00

Получил статистику по переводу разных версий по памяти переводов на 07.07.2012:

        prev    =100%  >90%   <90%
4.3.5:  38.0%  36.6%  0.3%  63.1%  3149
4.4.3:  67.2%  68.2%  0.4%  31.4%  3748
4.5.3:  57.9%   0.0%  0.6%  99.4%  4004
4.6.4:  66.7%   0.0%  0.2%  99.8%  4979
4.7.3:  15.2%  67.1%  0.0%  32.9%  5619
4.7.4:  15.2%  14.7%  3.1%  82.3%  5877
4.8.3:          0.0%  3.3%  96.7%  6313
5.0.0:          0.0%  5.4%  94.6%  6924

Первый столбец - http://www.forum.crossplatform.ru/index.php?showtopic=1029&view=findpost&p=43113.
Второй - на 100% переведенные файлы.
Третий - перевод более 90%.
Четвертый - перевод менее 90%.
Пятый - всего файлов.

Что наблюдаем?
Если сравнивать с http://www.forum.crossplatform.ru/index.php?showtopic=1029&view=findpost&p=43113 (представлена в первом столбце), то видно, что есть:

Выводы: процент перевода очень сильно зависит от исходного кода в документации. Зачем ему постоянно меняют оформление - мне непонятно, но это есть. Причём, самое интересное то, что конечному пользователю документации всё равно, "переведён" в ней код или нет. Это нужно только нам для понимания того, за что браться переводить.
Отсюда появляется желание сделать программу, которая будет автоматически выяснять, является ли сегмент кодом, и если да, добавлять для него перевод. Как это реализовать, пока нет ни малейшего понятия. Так что если у кого будут идеи, давайте обсудим.

Автор: iReset 11.12.2012, 14:32

Статистика по состоянию на декабрь 2012.
По файлам:

Ver  :   =100%   >=90%    <90%   Total
4.3.5:   64.5%    2.0%   33.5%   3149
4.4.3:   69.7%    0.7%   29.6%   3748
4.5.3:   65.9%    3.7%   30.4%   4004
4.6.4:   67.4%    1.4%   31.2%   4979
4.7.3:   69.1%    6.5%   24.5%   5619
4.7.4:   69.7%    1.2%   29.1%   5877
4.8.3:   56.5%   10.0%   33.5%   6313
4.8.4:    0.0%   65.4%   34.6%   6313

Как видно, процент перевода по всем версиям до 4.8.х выровнялся. И даже 4.8.3 с учётом 90%-ного перевода догоняет лидеров. По версии 4.8.4 могу сказать следующее: на 100% переведённых файлов нет из-за пары-тройки специфичных для этой версии строк (версию 4.8.4 мы пока не брали в перевод). Зато количество файлов с переводом 90% почти совпадает с 4.8.3. Так что вроде и с версией 4.8.4 все хорошо. Версия 4.7.4 была в догоняющих за этот период (с июля 2012), а вот по версии 4.7.3 видно, что объем переведённой документации увеличился на 2% полностью переведённых файлов и на 6,5% почти переведённых.

Автор: iReset 15.1.2013, 15:06

Статистика по состоянию на январь 2013.
По файлам:

Ver  :   =100%   >=90%    <90%   Total
4.3.5:   73.3%    0.3%   26.4%   3149
4.4.3:   76.0%    0.1%   23.8%   3748
4.5.3:   75.8%    0.2%   23.9%   4004
4.6.4:   77.7%    0.1%   22.2%   4979
4.7.4:   77.1%    0.2%   22.7%   5877
4.8.4:   78.2%    1.1%   20.7%   6313

Мы наконец-то сравняли процент перевода по всем поддерживаемым версиям. "Немного недопереведённых" файлов практически нет. С июля 2012 года, если ориентироваться на версию 4.6.4, процент перевода вырос с 66,7% до 77,7%.

По уникальным сегментам:
Ver  :      %  Total
4.3.5:  56.8%  187646
4.4.3:  58.0%  211104
4.5.3:  58.0%  225164
4.6.4:  59.4%  258573
4.7.4:  56.0%  340613
4.8.4:  62.8%  349974
5.0.0:  29.0%  280365
UPD: Информацию по версии 5.0.0 привёл только для справки, насколько я знаю, пока за её перевод никто не брался.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)