Головнев Максим #251

maximka200 · 2025-11-03T08:32:56Z

Планирую такую логику:

Текст на вход приходит в Lexer, где он переводится в List (список слов, пробелов, значащих символов)
List приходит в Parser, откуда приходит уже выровненный по структуре и иерархии корень дерева типа Node (дерево позволит нам определять вложенные теги)
Затем из этого дерева генерится html в HtmlGenerator

Планирую такую логику: - Текст на вход приходит в Lexer, где он переводится в List<Token> (список слов, пробелов, значащих символов) - List<Token> приходит в Parser, откуда приходит уже выровненный по структуре и иерархии корень дерева типа Node (дерево позволит нам определять вложенные теги) - Затем из этого дерева генерится html в HtmlGenerator

maximka200 · 2025-11-03T08:33:05Z

@Dimques

- Добавил проект с тестами и написал простые тесты на MdLexer.cs - Реализовал логику считывания токенов в MdLexer.cs (слова, #, _)

cs/Markdown/Lexer/MdLexer.cs

cs/Markdown/Markdown.cs

cs/MarkdownTests/LexerTests.cs

- Создал класс TokenParserTests.cs

- Дописал типы Node в NodeType - Дописал типы Token в TokenType - Убрал поле text из базовой ноды

- Написал базовую реализацию в декларативном стиле и без некоторой логики, поэтому не все тесты проходят

- добавил класс-раширение для List<MdToken> - более менее декомпозировал метод Parse - не работает условие с одинарными тегами внутри двойных/наоборот

…х словах

- убрал некорректный тест в ListMdTokenTests.cs - сделал логику чтобы работало условие на вложенность Bold в Italic/наоборот - поправил тесты в TokenParserTests.cs

- написал HtmlGenerator.cs

- Пофиксил некорректное экранирование - Косметические правки

- дописал перфоманс тест

- убрал ref из GetLengthChainOfTokenTypeAfter

cs/Markdown/Domains/NodeExtensions/HeaderNode.cs

cs/Markdown/Domains/TokenType.cs

cs/Markdown/Generator/HtmlGenerator.cs

cs/Markdown/Lexer/MdLexer.cs

cs/Markdown/Parser/TokenParser.cs

cs/MarkdownTests/Lexer/LexerTests.cs

cs/MarkdownTests/MarkdownEndToEndTests.cs

cs/MarkdownTests/HtmlGenerator/HtmlGeneratorTests.cs

cs/MarkdownTests/MarkdownPerformanceTests.cs

- правки по ListMdTokenExtension.cs

- переписал перформанс тест, теперь он не флокает - разбил функциональные тесты - пофиксил баг в IsUnderscoreInWordWithNumbers

cs/Markdown/Domains/IToHtml.cs

cs/Markdown/Domains/Node.cs

cs/Markdown/Domains/TokenType.cs

cs/Markdown/Generator/HtmlGenerator.cs

cs/MarkdownTests/HtmlGenerator/HtmlGeneratorTests.cs

cs/MarkdownTests/Lexer/LexerTests.cs

cs/MarkdownTests/MarkdownPerformanceTests.cs

Dimques · 2025-11-15T07:30:55Z

cs/MarkdownTests/MarkdownPerformanceTests.cs

+        {
+            var markdown = GenerateRandomMarkdown(length);
+            sw.Start();
+            GC.Collect();


Нуууу такое, конечно. А между сборками мусора будет работать, как попало, да?

cs/MarkdownTests/MarkdownFuncTests.cs

- дописал тестов на ранее неработающие сценарии - разбил TokenParser.cs на регионы для читаемости

- переписал тесты под нее

Dimques · 2025-11-26T15:29:49Z

cs/MarkdownTests/MarkdownFuncTests.cs

+    [TestCase("#  H1\n##  H2\n###  H3", "<h1>H1</h1><br/><h2>H2</h2><br/><h3>H3</h3>")]
+    [TestCase("# _text_ __text__", "<h1><em>text</em> <strong>text</strong></h1>")]
+    [TestCase("  ## h1", "  ## h1")]
+    [TestCase("########### h1", "########### h1")]


Здесь лучше было использовать ровно семь гридов, чтобы показать границу числа гридов, начиная с которой другое поведение будет, т.е. подчеркнуть edge-case.

Dimques · 2025-11-26T15:35:15Z

cs/MarkdownTests/MarkdownFuncTests.cs

+    [TestCase("# _text_ __text__", "<h1><em>text</em> <strong>text</strong></h1>")]
+    [TestCase("  ## h1", "  ## h1")]
+    [TestCase("########### h1", "########### h1")]
+    [TestCase("#", "<h1></h1>")] //  в оригинальном Md также


В общем случае это не аргумент - "все совпадения случайны" :)

Dimques · 2025-11-26T15:43:48Z

cs/MarkdownTests/MarkdownFuncTests.cs

+    [Test]
+    [TestCase("Text with _underscores_ inside", "Text with <em>underscores</em> inside")]
+    [TestCase("__Bold__ _Italic_ __Mixed__", "<strong>Bold</strong> <em>Italic</em> <strong>Mixed</strong>")]
+    [TestCase("root1_2_3", "root1_2_3")]


Не работает кейс

Dimques · 2025-11-26T15:44:49Z

cs/MarkdownTests/MarkdownFuncTests.cs

+    }
+
+    [Test]
+    [TestCase(@"Escaped \_underscore\_", "Escaped _underscore_")]


Существует, скажем так, правило хорошего тона - ишуи резолвит тот, кто их завёл.

Существует, скажем так, правило хорошего тона - ишуи резолвит тот, кто их завёл.

понял, просто удобно, проще понимать что сделал/что нет

Dimques · 2025-11-26T15:47:25Z

cs/MarkdownTests/MarkdownFuncTests.cs

+
+    [Test]
+    [TestCase("TEXT!???", "TEXT!???")]
+    [TestCase("_Test_\n## Header ##\n__word__ _word_",


\n - эх, проворонил такой повод подушнить :( На будущее - используй лучше Environment.NewLine, в разных системах оно разное значение имеет.

Dimques · 2025-11-26T15:48:13Z

cs/MarkdownTests/MarkdownPerformanceTests.cs

+            var markdown = GenerateRandomMarkdown(length);
+            sw.Start();
+            Render(markdown);
+            GC.Collect();


Ну уж если хватило сил все замечания исправить, мог бы и эту ерунду поправить :)

Dimques · 2025-11-26T15:58:43Z

cs/MarkdownTests/MarkdownFuncTests.cs

+    [TestCase(@"\\[text](example.com)", """\<a href="example.com">text</a>""")]
+    [TestCase(@"Escaped _underscore\__", "Escaped <em>underscore_</em>")]
+    [TestCase(@"[text\\](example.com)", """<a href="example.com">text\</a>""")]
+    [TestCase("_underscore _", "_underscore _")]


Ну кажется на tab надо ещё внимательно посмотреть

maximka200 added 2 commits November 4, 2025 02:39

Добавил тестов и вынес метод CollectFullValue в MdLexer.cs

6fc0993

maximka200 force-pushed the markdown branch from a0e0b01 to 6fc0993 Compare November 4, 2025 09:23

Dimques suggested changes Nov 6, 2025

View reviewed changes

maximka200 added 16 commits November 6, 2025 14:01

- Создал класс HeaderNode - наследника Node

aa264ce

- Создал класс TokenParserTests.cs

правки замечаний

9f1d158

- Вынес TextNode в отдельный класс

cc8ea9e

- Дописал типы Node в NodeType - Дописал типы Token в TokenType - Убрал поле text из базовой ноды

- fix TextNode.cs

33fc30c

- Написал тесты

1814946

- Написал базовую реализацию в декларативном стиле и без некоторой логики, поэтому не все тесты проходят

сделал корректное определение подчеркивания в словах с числами, разны…

db027d7

…х словах

косметические правки

d44899e

- написал тест на HtmlGenerator.cs

8257f70

- написал HtmlGenerator.cs

Декомпозировал Parse

4ba0ed4

- Написал сквозные тесты

6d74d7c

- Пофиксил некорректное экранирование - Косметические правки

написал перформанс тест

7e3a534

- реализовал ссылки (еще не написал по ним спеки)

aee479e

- дописал перфоманс тест

- улучшил читаемость

0e1858f

- убрал ref из GetLengthChainOfTokenTypeAfter

написал спеки для гиперссылки

f126b28

Dimques suggested changes Nov 12, 2025

View reviewed changes

Dimques suggested changes Nov 13, 2025

View reviewed changes

maximka200 added 5 commits November 13, 2025 14:59

- правки по MdLexer.cs

68dc63a

- правки по ListMdTokenExtension.cs

- правки по TokenParser.cs

c220d12

- уточнил спеки

2a710e4

- переписал перформанс тест, теперь он не флокает - разбил функциональные тесты - пофиксил баг в IsUnderscoreInWordWithNumbers

переименовал неймспейс NodeTypes -> Nodes

d24a8d7

дописал тестов на header и пофиксил методы для его парсинга

34850a4

Dimques suggested changes Nov 15, 2025

View reviewed changes

maximka200 added 4 commits November 22, 2025 00:16

- пофиксил основные замечания

1d4e962

- дописал тестов на ранее неработающие сценарии - разбил TokenParser.cs на регионы для читаемости

- переписал структуру генерации Html

505a973

- переписал тесты под нее

- переписал на Try метод

5cd805f

- поправил тесты

937b8ab

Dimques reviewed Nov 26, 2025

View reviewed changes

Головнев Максим #251

Are you sure you want to change the base?

Головнев Максим #251

Uh oh!

Conversation

maximka200 commented Nov 3, 2025

Uh oh!

maximka200 commented Nov 3, 2025

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants