fix:tokenizing sentence by verb is failing. #116
Merged
Add this suggestion to a batch that can be applied as a single commit.
This suggestion is invalid because no changes were made to the code.
Suggestions cannot be applied while the pull request is closed.
Suggestions cannot be applied while viewing a subset of changes.
Only one suggestion per line can be applied in a batch.
Add this suggestion to a batch that can be applied as a single commit.
Applying suggestions on deleted lines is not supported.
You must change the existing code in this line in order to create a valid suggestion.
Outdated suggestions cannot be applied.
This suggestion has been applied or marked resolved.
Suggestions cannot be applied from pending reviews.
Suggestions cannot be applied on multi-line comments.
Suggestions cannot be applied while the pull request is queued to merge.
Suggestion cannot be applied right now. Please check back later.
Bug:
Input: "༄༅། །འཇམ་དཔལ་གཞོན་ནུར་གྱུར་པ་ལ་ཕྱག་འཚལ་ལོ། །ཆོས་གང་དག་ཐོག་མར་དགེ་བ། བར་དུ་དགེ་བ། ཐ་མར་དགེ་བ། དོན་བཟང་པོ། །ཚིག་འབྲུ་བཟང་པོ། མ་འདྲེས་པ། ཡོངས་སུ་རྫོགས་པ། ཡོངས་སུ་དག་པ། ཡོངས་སུ་བྱང་བ། ཚངས་པར་སྤྱོད་པ། མངོན་པར་བརྗོད་པས་མངོན་པར་རྗོད་པར་བྱེད་པ་ནི་མང་དུ་ཐོས་པ་དང་། ཐོས་པའི་གཞི་ཅན་དང་། ཐོས་པ་བསགས་པ་ཡིན་ཏེ། "
Output: '༄༅། ། འཇམ་དཔལ་ གཞོན་ནུ་ -ར་ གྱུར་པ་ ལ་ ཕྱག་ འཚལ་ ལོ་ ། ། ཆོས་ གང་དག་ ཐོག་མ་ -ར་ དགེ་བ་ ། བར་ དུ་ དགེ་བ་ ། ཐ་མ་ -ར་ དགེ་བ་ ། དོན་ བཟང་པོ་ ། ། ཚིག་འབྲུ་ བཟང་པོ་ ། མ་ འདྲེས་པ་ ། ཡོངས་སུ་ རྫོགས་པ་ ། ཡོངས་སུ་ དག་པ་ ། ཡོངས་སུ་ བྱང་བ་ ། ཚངས་པ་ -ར་ སྤྱོད་པ་ ། མངོན་པར་ བརྗོད་པ་ -ས་ མངོན་པར་ རྗོད་པ་ -ར་ བྱེད་པ་ ནི་ མང་ དུ་ ཐོས་པ་ དང་ ། ཐོས་པ་ -འི་ གཞི་ ཅན་ དང་ ། ཐོས་པ་ བསགས་པ་ ཡིན་ ཏེ'
Expected output: "༄༅། ། འཇམ་དཔལ་ གཞོན་ནུ་ -ར་ གྱུར་པ་ ལ་ ཕྱག་ འཚལ་ ལོ་ ། ། ཆོས་ གང་དག་ ཐོག་མ་ -ར་ དགེ་བ་ ། བར་ དུ་ དགེ་བ་ ། ཐ་མ་ -ར་ དགེ་བ་ ། དོན་ བཟང་པོ་ ། ། ཚིག་འབྲུ་ བཟང་པོ་ ། མ་ འདྲེས་པ་ ། ཡོངས་སུ་ རྫོགས་པ་ ། ཡོངས་སུ་ དག་པ་ ། ཡོངས་སུ་ བྱང་བ་ ། ཚངས་པ་ -ར་ སྤྱོད་པ་ ། མངོན་པར་ བརྗོད་པ་ -ས་ མངོན་པར་ རྗོད་པ་ -ར་ བྱེད་པ་ ནི་ མང་ དུ་ ཐོས་པ་ དང་ ། ཐོས་པ་ -འི་ གཞི་ ཅན་ དང་ ། ཐོས་པ་ བསགས་པ་ ཡིན་ ཏེ་ །"
But if we comment this line. it is working. therefore the current PR has commented that line