Спроектировал парсер Markdown #256

Kpokoko · 2025-11-03T15:34:50Z

Написал первоначальную предполагаемую структуру парсера @OvchinnikovNikita

OvchinnikovNikita · 2025-11-05T18:38:26Z

Markdown/Markdown/Md.cs

@@ -0,0 +1,24 @@
+namespace Markdown;
+
+public class Md


Плохое название, давай поменяем

OvchinnikovNikita · 2025-11-05T18:39:58Z

Markdown/Markdown/Token.cs

@@ -0,0 +1,9 @@
+namespace Markdown;
+
+public class Token


Напишу здесь, но относится и к другим аналогичным местам: используй свойства вместо полей, например: public int StartIndex { get; set; }

OvchinnikovNikita · 2025-11-05T18:41:24Z

Markdown/Markdown/TokenType.cs

+
+public enum TokenType
+{
+    Italics = 0,


Italic

Обычно нулевой элемент оставляют для значений по типу Unknown - это помогает избежать ошибок, связанных с проставлением значения по умолчанию. Давай здесь сделаем также

OvchinnikovNikita · 2025-11-05T18:43:04Z

Markdown/Markdown/TokenType.cs

@@ -0,0 +1,8 @@
+namespace Markdown;
+
+public enum TokenType


Enum автоматически номеруется с нуля и далее по натуральным числам, обычно так явно не прописывают, только если не хотят явно изменить нумерацию. Здесь явно указана стандартная нумерация, поэтому, в целом, можно убрать. Править не заставляю - опционально. Если так привычнее - оставь

OvchinnikovNikita · 2025-11-05T18:49:19Z

Markdown/Markdown/Md.cs

@@ -0,0 +1,24 @@
+namespace Markdown;
+
+public class Md


Давай вынесем все эти методы в интерфейс, и сделаем класс Md (не забудь поменять название) имплементацией этого интерфейса. Придумай соответствующее название для интерфейса

OvchinnikovNikita · 2025-11-15T19:50:19Z

Markdown/Markdown/IParser.cs

@@ -0,0 +1,10 @@
+namespace Markdown;
+
+public interface IParser


IParser - обобщенное название, но методы выставлены довольно специфичные, ещё и метод Parse, который, логично, должен выставлять парсер, отсутствует, зато есть метод Render) В реальном проекте это будет страшно путать других разработчиков, которые впервые видят этот код. Давай разберёмся с названиями

OvchinnikovNikita · 2025-11-15T19:51:30Z

Markdown/Markdown/MarkdownParser.cs

+
+public class MarkdownParser : IParser
+{
+    private static Dictionary<string, TokenType> _pairMarkdownToTag = new()


Сделай readonly

OvchinnikovNikita · 2025-11-15T20:00:32Z

Markdown/Markdown/MarkdownParser.cs

+
+    private string _markdown;
+
+    public void SetMarkdownText(string markdown) => this._markdown = markdown; // Только для теста обёртки токенов в теги


Ты здесь нарушаешь инкапсуляцию, устанавливая состояние парсера извне ради тестов - плохая практика. Давай от этого избавимся, но чтобы тест работал. Например, попробуй подумать над тем, чтобы передавать markdown явно в WrapTokensWithTags или что-то другое придумай

OvchinnikovNikita · 2025-11-15T20:05:28Z

Markdown/Markdown/MarkdownParser.cs

+            }
+            else
+                currentTag = markdown[i].ToString();
+            if (currentTag == "#")


Это условие никогда не выполняется - в _pairMarkdownToTag отсутствует #

OvchinnikovNikita · 2025-11-15T20:18:00Z

Markdown/Markdown/MarkdownParser.cs

+                    token.StartIndex - currEndIndex));
+            if (token.StartIndex >= currEndIndex)
+                htmlString.Append(wrappedTags[i]);
+            else


Код в блоке else работает неэффективно и реализация через replace может быть довольно хрупкой. Лучше строить HTML за один проход без замен, подумай, как избавиться от этих проблем

OvchinnikovNikita · 2025-11-15T20:41:21Z

Markdown/Markdown/MarkdownTagValidator.cs

+                            && (start > 1 && _markdown[start - 2] != '\\');
+        if (isOpeningTag)
+            return !isTagScreened && _markdown[start + length] != ' '
+                   || (_markdown[start] == '#' && _markdown[start] == '#' && _markdown[start + 1] == ' ');


Аналогично, условие `_markdown[start] == '#' бесполезное

OvchinnikovNikita · 2025-11-15T20:41:37Z

Markdown/Markdown/MarkdownTagValidator.cs

+            return !isTagScreened && _markdown[start + length] != ' '
+                   || (_markdown[start] == '#' && _markdown[start] == '#' && _markdown[start + 1] == ' ');
+        return !isTagScreened && _markdown[start - 1] != ' '
+               || (_markdown[start] == '#' && start + length <= _markdown.Length && _markdown[start + 1] == ' ');


Аналогично

OvchinnikovNikita · 2025-11-15T20:43:20Z

Markdown/Markdown/MarkdownTagValidator.cs

+        return !string.IsNullOrEmpty(_markdown.Substring(start, end - start + 1));
+    }
+
+    public bool HasTagDigitsInside(int start, int end)


Посмотри на название метода и на возвращаемое значение в return. Ничего не смущает?)

OvchinnikovNikita · 2025-11-15T20:45:19Z

Markdown/Markdown/Program.cs

@@ -0,0 +1,7 @@
+// public class Program


На всякий случай напишу: в реальный проект такие изменения закомментированные без пояснений лучше не заливать)

OvchinnikovNikita · 2025-11-15T20:48:40Z

Markdown/Markdown/TagBuilder.cs

+            case "Title":
+                return (Header.OpeningTag, Header.ClosingTag);
+            case "ListItem":
+                return (ListItem.OpeningTag, ListItem.OpeningTag);


Дважды ListItem.OpeningTag - очепятка

Кстати в действительности этот сценарий - мертвый код, т.к. списки обрабатываются в ProcessUnpairLineTags. Ещё один минус в копилку ProcessUnpairLineTags

Спроектировал парсер Markdown

cbd5e5b

OvchinnikovNikita reviewed Nov 5, 2025

View reviewed changes

Kpokoko added 5 commits November 8, 2025 17:43

Написал тесты, немного поправил архитектуру

65494cc

реализовал токенизатор + валидатор тегов

3a8f9ae

Доделал базовый парсер, немного расширил архитектуру

80b1d81

Добавил рендеринг неупорядоченных листов

3830474

Добавил забытые тесты на производительность

321270b

OvchinnikovNikita reviewed Nov 15, 2025

View reviewed changes

Kpokoko added 2 commits November 17, 2025 19:16

Отрефакторил мелкие моменты, изменил создание итоговой строки

ec9c046

Внёс функциональность метода ProcessUnpairLineTags в TokenizeText

50d1fa8


		private string _markdown;

		public void SetMarkdownText(string markdown) => this._markdown = markdown; // Только для теста обёртки токенов в теги

Спроектировал парсер Markdown #256

Are you sure you want to change the base?

Спроектировал парсер Markdown #256

Uh oh!

Conversation

Kpokoko commented Nov 3, 2025

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants