1 files changed, 215 insertions, 211 deletions
diff --git a/src/Text/Pandoc/Readers/Markdown.hs b/src/Text/Pandoc/Readers/Markdown.hs
index 4807baada..f8349ea99 100644
--- a/src/Text/Pandoc/Readers/Markdown.hs
+++ b/src/Text/Pandoc/Readers/Markdown.hs
@@ -1,7 +1,9 @@
-{-# LANGUAGE NoImplicitPrelude #-}
+{-# LANGUAGE NoImplicitPrelude   #-}
 {-# LANGUAGE RelaxedPolyRec      #-}
 {-# LANGUAGE ScopedTypeVariables #-}
-{-# LANGUAGE TupleSections #-}
+{-# LANGUAGE TupleSections       #-}
+{-# LANGUAGE OverloadedStrings   #-}
+{-# LANGUAGE ViewPatterns        #-}
 {- |
    Module      : Text.Pandoc.Readers.Markdown
    Copyright   : Copyright (C) 2006-2019 John MacFarlane
@@ -19,14 +21,15 @@ import Prelude
 import Control.Monad
 import Control.Monad.Except (throwError)
 import qualified Data.ByteString.Lazy as BS
-import Data.Char (isAlphaNum, isPunctuation, isSpace, toLower)
-import Data.List (intercalate, sortBy, transpose, elemIndex)
+import Data.Char (isAlphaNum, isPunctuation, isSpace)
+import Data.List (sortBy, transpose, elemIndex)
 import qualified Data.Map as M
 import Data.Maybe
 import Data.Ord (comparing)
 import qualified Data.Set as Set
 import Data.Text (Text)
 import qualified Data.Text as T
+import qualified Data.Text.Lazy as TL
 import qualified Data.YAML as YAML
 import qualified Data.YAML.Event as YE
 import System.FilePath (addExtension, takeExtension)
@@ -47,7 +50,7 @@ import Text.Pandoc.Shared
 import qualified Text.Pandoc.UTF8 as UTF8
 import Text.Pandoc.XML (fromEntities)
 
-type MarkdownParser m = ParserT [Char] ParserState m
+type MarkdownParser m = ParserT Text ParserState m
 
 -- | Read markdown from an input string and return a Pandoc document.
 readMarkdown :: PandocMonad m
@@ -56,7 +59,7 @@ readMarkdown :: PandocMonad m
              -> m Pandoc
 readMarkdown opts s = do
   parsed <- readWithM parseMarkdown def{ stateOptions = opts }
-               (T.unpack (crFilter s) ++ "\n\n")
+               (crFilter s <> "\n\n")
   case parsed of
     Right result -> return result
     Left e       -> throwError e
@@ -77,7 +80,7 @@ isHruleChar '-' = True
 isHruleChar '_' = True
 isHruleChar _   = False
 
-setextHChars :: String
+setextHChars :: [Char]
 setextHChars = "=-"
 
 isBlank :: Char -> Bool
@@ -96,30 +99,30 @@ inList = do
   ctx <- stateParserContext <$> getState
   guard (ctx == ListItemState)
 
-spnl :: PandocMonad m => ParserT [Char] st m ()
+spnl :: PandocMonad m => ParserT Text st m ()
 spnl = try $ do
   skipSpaces
   optional newline
   skipSpaces
   notFollowedBy (char '\n')
 
-spnl' :: PandocMonad m => ParserT [Char] st m String
+spnl' :: PandocMonad m => ParserT Text st m Text
 spnl' = try $ do
   xs <- many spaceChar
   ys <- option "" $ try $ (:) <$> newline
                               <*> (many spaceChar <* notFollowedBy (char '\n'))
-  return (xs ++ ys)
+  return $ T.pack $ xs ++ ys
 
-indentSpaces :: PandocMonad m => MarkdownParser m String
+indentSpaces :: PandocMonad m => MarkdownParser m Text
 indentSpaces = try $ do
   tabStop <- getOption readerTabStop
-  count tabStop (char ' ') <|>
-    string "\t" <?> "indentation"
+  countChar tabStop (char ' ') <|>
+    textStr "\t" <?> "indentation"
 
-nonindentSpaces :: PandocMonad m => MarkdownParser m String
+nonindentSpaces :: PandocMonad m => MarkdownParser m Text
 nonindentSpaces = do
   n <- skipNonindentSpaces
-  return $ replicate n ' '
+  return $ T.replicate n " "
 
 -- returns number of spaces parsed
 skipNonindentSpaces :: PandocMonad m => MarkdownParser m Int
@@ -139,8 +142,9 @@ inlinesInBalancedBrackets :: PandocMonad m => MarkdownParser m (F Inlines)
 inlinesInBalancedBrackets =
   try $ char '[' >> withRaw (go 1) >>=
           parseFromString inlines . stripBracket . snd
-  where stripBracket [] = []
-        stripBracket xs = if last xs == ']' then init xs else xs
+  where stripBracket t = case T.unsnoc t of
+          Just (t', ']') -> t'
+          _              -> t
         go :: PandocMonad m => Int -> MarkdownParser m ()
         go 0 = return ()
         go openBrackets =
@@ -160,7 +164,7 @@ inlinesInBalancedBrackets =
 -- document structure
 --
 
-rawTitleBlockLine :: PandocMonad m => MarkdownParser m String
+rawTitleBlockLine :: PandocMonad m => MarkdownParser m Text
 rawTitleBlockLine = do
   char '%'
   skipSpaces
@@ -169,7 +173,7 @@ rawTitleBlockLine = do
                           notFollowedBy blankline
                           skipSpaces
                           anyLine
-  return $ trim $ unlines (first:rest)
+  return $ trim $ T.unlines (first:rest)
 
 titleLine :: PandocMonad m => MarkdownParser m (F Inlines)
 titleLine = try $ do
@@ -222,9 +226,9 @@ yamlMetaBlock = try $ do
   notFollowedBy blankline  -- if --- is followed by a blank it's an HRULE
   rawYamlLines <- manyTill anyLine stopLine
   -- by including --- and ..., we allow yaml blocks with just comments:
-  let rawYaml = unlines ("---" : (rawYamlLines ++ ["..."]))
+  let rawYaml = T.unlines ("---" : (rawYamlLines ++ ["..."]))
   optional blanklines
-  newMetaF <- yamlBsToMeta $ UTF8.fromStringLazy rawYaml
+  newMetaF <- yamlBsToMeta $ UTF8.fromTextLazy $ TL.fromStrict rawYaml
   -- Since `<>` is left-biased, existing values are not touched:
   updateState $ \st -> st{ stateMeta' = (stateMeta' st) <> newMetaF }
   return mempty
@@ -255,7 +259,7 @@ yamlBsToMeta bstr = do
                   return . return $ mempty
        Left (_pos, err') -> do
                     logMessage $ CouldNotParseYamlMetadata
-                                 err' pos
+                                 (T.pack err') pos
                     return . return $ mempty
 
 nodeToKey :: PandocMonad m => YAML.Node YE.Pos -> m Text
@@ -270,11 +274,11 @@ toMetaValue x =
    -- Note: a standard quoted or unquoted YAML value will
    -- not end in a newline, but a "block" set off with
    -- `|` or `>` will.
-   if (T.pack "\n") `T.isSuffixOf` x
-      then parseFromString' (asBlocks <$> parseBlocks) (xstring <> "\n")
+   if "\n" `T.isSuffixOf` x
+      then parseFromString' (asBlocks <$> parseBlocks) (x <> "\n")
       else parseFromString'
              ((asInlines <$> try pInlines) <|> (asBlocks <$> parseBlocks))
-             xstring
+             x
   where pInlines = trimInlinesF . mconcat <$> manyTill inline eof
         asBlocks p = do
           p' <- p
@@ -282,7 +286,6 @@ toMetaValue x =
         asInlines p = do
           p' <- p
           return $ MetaInlines (B.toList p')
-        xstring = T.unpack x
 
 checkBoolean :: Text -> Maybe Bool
 checkBoolean t =
@@ -298,8 +301,8 @@ yamlToMetaValue (YAML.Scalar _ x) =
   case x of
        YAML.SStr t       -> toMetaValue t
        YAML.SBool b      -> return $ return $ MetaBool b
-       YAML.SFloat d     -> return $ return $ MetaString (show d)
-       YAML.SInt i       -> return $ return $ MetaString (show i)
+       YAML.SFloat d     -> return $ return $ MetaString $ tshow d
+       YAML.SInt i       -> return $ return $ MetaString $ tshow i
        YAML.SUnknown _ t ->
          case checkBoolean t of
            Just b        -> return $ return $ MetaBool b
@@ -315,7 +318,7 @@ yamlToMetaValue _ = return $ return $ MetaString ""
 
 yamlMap :: PandocMonad m
         => M.Map (YAML.Node YE.Pos) (YAML.Node YE.Pos)
-        -> MarkdownParser m (F (M.Map String MetaValue))
+        -> MarkdownParser m (F (M.Map Text MetaValue))
 yamlMap o = do
     kvs <- forM (M.toList o) $ \(key, v) -> do
              k <- nodeToKey key
@@ -323,12 +326,12 @@ yamlMap o = do
     let kvs' = filter (not . ignorable . fst) kvs
     (fmap M.fromList . sequence) <$> mapM toMeta kvs'
   where
-    ignorable t = (T.pack "_") `T.isSuffixOf` t
+    ignorable t = "_" `T.isSuffixOf` t
     toMeta (k, v) = do
       fv <- yamlToMetaValue v
       return $ do
         v' <- fv
-        return (T.unpack k, v')
+        return (k, v')
 
 stopLine :: PandocMonad m => MarkdownParser m ()
 stopLine = try $ (string "---" <|> string "...") >> blankline >> return ()
@@ -343,14 +346,14 @@ mmdTitleBlock = try $ do
   updateState $ \st -> st{ stateMeta' = stateMeta' st <>
                              return (Meta $ M.fromList kvPairs) }
 
-kvPair :: PandocMonad m => Bool -> MarkdownParser m (String, MetaValue)
+kvPair :: PandocMonad m => Bool -> MarkdownParser m (Text, MetaValue)
 kvPair allowEmpty = try $ do
-  key <- many1Till (alphaNum <|> oneOf "_- ") (char ':')
-  val <- trim <$> manyTill anyChar
+  key <- many1TillChar (alphaNum <|> oneOf "_- ") (char ':')
+  val <- trim <$> manyTillChar anyChar
           (try $ newline >> lookAhead (blankline <|> nonspaceChar))
-  guard $ allowEmpty || not (null val)
-  let key' = concat $ words $ map toLower key
-  let val' = MetaBlocks $ B.toList $ B.plain $B.text val
+  guard $ allowEmpty || not (T.null val)
+  let key' = T.concat $ T.words $ T.toLower key
+  let val' = MetaBlocks $ B.toList $ B.plain $ B.text val
   return (key',val')
 
 parseMarkdown :: PandocMonad m => MarkdownParser m Pandoc
@@ -380,13 +383,13 @@ referenceKey = try $ do
   (_,raw) <- reference
   char ':'
   skipSpaces >> optional newline >> skipSpaces >> notFollowedBy (char '[')
-  let sourceURL = fmap unwords $ many $ try $ do
+  let sourceURL = fmap T.unwords $ many $ try $ do
                     skipMany spaceChar
                     notFollowedBy' referenceTitle
                     notFollowedBy' $ guardEnabled Ext_link_attributes >> attributes
                     notFollowedBy' (() <$ reference)
-                    many1 $ notFollowedBy space >> litChar
-  let betweenAngles = try $ char '<' >> manyTill litChar (char '>')
+                    many1Char $ notFollowedBy space >> litChar
+  let betweenAngles = try $ char '<' >> manyTillChar litChar (char '>')
   src <- try betweenAngles <|> sourceURL
   tit <- option "" referenceTitle
   attr   <- option nullAttr $ try $
@@ -411,20 +414,20 @@ referenceKey = try $ do
   updateState $ \s -> s { stateKeys = M.insert key (target, attr') oldkeys }
   return $ return mempty
 
-referenceTitle :: PandocMonad m => MarkdownParser m String
+referenceTitle :: PandocMonad m => MarkdownParser m Text
 referenceTitle = try $ do
   skipSpaces >> optional newline >> skipSpaces
   quotedTitle '"' <|> quotedTitle '\'' <|> charsInBalanced '(' ')' litChar
 
 -- A link title in quotes
-quotedTitle :: PandocMonad m => Char -> MarkdownParser m String
+quotedTitle :: PandocMonad m => Char -> MarkdownParser m Text
 quotedTitle c = try $ do
   char c
   notFollowedBy spaces
   let pEnder = try $ char c >> notFollowedBy (satisfy isAlphaNum)
-  let regChunk = many1 (noneOf ['\\','\n','&',c]) <|> count 1 litChar
-  let nestedChunk = (\x -> [c] ++ x ++ [c]) <$> quotedTitle c
-  unwords . words . concat <$> manyTill (nestedChunk <|> regChunk) pEnder
+  let regChunk = many1Char (noneOf ['\\','\n','&',c]) <|> countChar 1 litChar
+  let nestedChunk = (\x -> T.singleton c <> x <> T.singleton c) <$> quotedTitle c
+  T.unwords . T.words . T.concat <$> manyTill (nestedChunk <|> regChunk) pEnder
 
 -- | PHP Markdown Extra style abbreviation key.  Currently
 -- we just skip them, since Pandoc doesn't have an element for
@@ -440,21 +443,21 @@ abbrevKey = do
     blanklines
     return $ return mempty
 
-noteMarker :: PandocMonad m => MarkdownParser m String
-noteMarker = string "[^" >> many1Till (satisfy $ not . isBlank) (char ']')
+noteMarker :: PandocMonad m => MarkdownParser m Text
+noteMarker = string "[^" >> many1TillChar (satisfy $ not . isBlank) (char ']')
 
-rawLine :: PandocMonad m => MarkdownParser m String
+rawLine :: PandocMonad m => MarkdownParser m Text
 rawLine = try $ do
   notFollowedBy blankline
   notFollowedBy' $ try $ skipNonindentSpaces >> noteMarker
   optional indentSpaces
   anyLine
 
-rawLines :: PandocMonad m => MarkdownParser m String
+rawLines :: PandocMonad m => MarkdownParser m Text
 rawLines = do
   first <- anyLine
   rest <- many rawLine
-  return $ unlines (first:rest)
+  return $ T.unlines (first:rest)
 
 noteBlock :: PandocMonad m => MarkdownParser m (F Blocks)
 noteBlock = try $ do
@@ -466,7 +469,7 @@ noteBlock = try $ do
   optional indentSpaces
   first <- rawLines
   rest <- many $ try $ blanklines >> indentSpaces >> rawLines
-  let raw = unlines (first:rest) ++ "\n"
+  let raw = T.unlines (first:rest) <> "\n"
   optional blanklines
   parsed <- parseFromString' parseBlocks raw
   oldnotes <- stateNotes' <$> getState
@@ -510,7 +513,7 @@ block = do
                , para
                , plain
                ] <?> "block"
-  trace (take 60 $ show $ B.toList $ runF res defaultParserState)
+  trace (T.take 60 $ tshow $ B.toList $ runF res defaultParserState)
   return res
 
 --
@@ -570,7 +573,7 @@ mmdHeaderIdentifier :: PandocMonad m => MarkdownParser m Attr
 mmdHeaderIdentifier = do
   (_, raw) <- reference
   let raw' = trim $ stripFirstAndLast raw
-  let ident = concat $ words $ map toLower raw'
+  let ident = T.concat $ T.words $ T.toLower raw'
   let attr = (ident, [], [])
   guardDisabled Ext_implicit_header_references
     <|> registerImplicitHeader raw' attr
@@ -600,20 +603,20 @@ setextHeader = try $ do
     <|> registerImplicitHeader raw attr'
   return $ B.headerWith attr' level <$> text
 
-registerImplicitHeader :: PandocMonad m => String -> Attr -> MarkdownParser m ()
+registerImplicitHeader :: PandocMonad m => Text -> Attr -> MarkdownParser m ()
 registerImplicitHeader raw attr@(ident, _, _)
-  | null raw  = return ()
+  | T.null raw = return ()
   | otherwise = do
-      let key = toKey $ "[" ++ raw ++ "]"
+      let key = toKey $ "[" <> raw <> "]"
       updateState $ \s ->
-        s { stateHeaderKeys = M.insert key (('#':ident,""), attr)
+        s { stateHeaderKeys = M.insert key (("#" <> ident,""), attr)
                                      (stateHeaderKeys s) }
 
 --
 -- hrule block
 --
 
-hrule :: PandocMonad m => ParserT [Char] st m (F Blocks)
+hrule :: PandocMonad m => ParserT Text st m (F Blocks)
 hrule = try $ do
   skipSpaces
   start <- satisfy isHruleChar
@@ -627,13 +630,13 @@ hrule = try $ do
 -- code blocks
 --
 
-indentedLine :: PandocMonad m => MarkdownParser m String
+indentedLine :: PandocMonad m => MarkdownParser m Text
 indentedLine = indentSpaces >> anyLineNewline
 
 blockDelimiter :: PandocMonad m
                => (Char -> Bool)
                -> Maybe Int
-               -> ParserT [Char] ParserState m Int
+               -> ParserT Text ParserState m Int
 blockDelimiter f len = try $ do
   skipNonindentSpaces
   c <- lookAhead (satisfy f)
@@ -652,11 +655,11 @@ attributes = try $ do
 attribute :: PandocMonad m => MarkdownParser m (Attr -> Attr)
 attribute = identifierAttr <|> classAttr <|> keyValAttr <|> specialAttr
 
-identifier :: PandocMonad m => MarkdownParser m String
+identifier :: PandocMonad m => MarkdownParser m Text
 identifier = do
   first <- letter
   rest <- many $ alphaNum <|> oneOf "-_:."
-  return (first:rest)
+  return $ T.pack (first:rest)
 
 identifierAttr :: PandocMonad m => MarkdownParser m (Attr -> Attr)
 identifierAttr = try $ do
@@ -674,15 +677,15 @@ keyValAttr :: PandocMonad m => MarkdownParser m (Attr -> Attr)
 keyValAttr = try $ do
   key <- identifier
   char '='
-  val <- enclosed (char '"') (char '"') litChar
-     <|> enclosed (char '\'') (char '\'') litChar
+  val <- T.pack <$> enclosed (char '"') (char '"') litChar
+     <|> T.pack <$> enclosed (char '\'') (char '\'') litChar
      <|> ("" <$ try (string "\"\""))
      <|> ("" <$ try (string "''"))
-     <|> many (escapedChar' <|> noneOf " \t\n\r}")
+     <|> manyChar (escapedChar' <|> noneOf " \t\n\r}")
   return $ \(id',cs,kvs) ->
     case key of
          "id"    -> (val,cs,kvs)
-         "class" -> (id',cs ++ words val,kvs)
+         "class" -> (id',cs ++ T.words val,kvs)
          _       -> (id',cs,kvs ++ [(key,val)])
 
 specialAttr :: PandocMonad m => MarkdownParser m (Attr -> Attr)
@@ -690,12 +693,12 @@ specialAttr = do
   char '-'
   return $ \(id',cs,kvs) -> (id',cs ++ ["unnumbered"],kvs)
 
-rawAttribute :: PandocMonad m => MarkdownParser m String
+rawAttribute :: PandocMonad m => MarkdownParser m Text
 rawAttribute = do
   char '{'
   skipMany spaceChar
   char '='
-  format <- many1 $ satisfy (\c -> isAlphaNum c || c `elem` "-_")
+  format <- many1Char $ satisfy (\c -> isAlphaNum c || c `elem` ['-', '_']) 
   skipMany spaceChar
   char '}'
   return format
@@ -703,7 +706,7 @@ rawAttribute = do
 codeBlockFenced :: PandocMonad m => MarkdownParser m (F Blocks)
 codeBlockFenced = try $ do
   indentchars <- nonindentSpaces
-  let indentLevel = length indentchars
+  let indentLevel = T.length indentchars
   c <- try (guardEnabled Ext_fenced_code_blocks >> lookAhead (char '~'))
      <|> (guardEnabled Ext_backtick_code_blocks >> lookAhead (char '`'))
   size <- blockDelimiter (== c) Nothing
@@ -713,9 +716,9 @@ codeBlockFenced = try $ do
     <|>
      (Right <$> option ("",[],[])
          (try (guardEnabled Ext_fenced_code_attributes >> attributes)
-          <|> ((\x -> ("",[toLanguageId x],[])) <$> many1 nonspaceChar)))
+          <|> ((\x -> ("",[toLanguageId x],[])) <$> many1Char nonspaceChar)))
   blankline
-  contents <- intercalate "\n" <$>
+  contents <- T.intercalate "\n" <$>
                  manyTill (gobbleAtMostSpaces indentLevel >> anyLine)
                           (try $ do
                             blockDelimiter (== c) (Just size)
@@ -726,8 +729,8 @@ codeBlockFenced = try $ do
           Right attr -> B.codeBlockWith attr contents
 
 -- correctly handle github language identifiers
-toLanguageId :: String -> String
-toLanguageId = map toLower . go
+toLanguageId :: Text -> Text
+toLanguageId = T.toLower . go
   where go "c++"         = "cpp"
         go "objective-c" = "objectivec"
         go x             = x
@@ -737,11 +740,11 @@ codeBlockIndented = do
   contents <- many1 (indentedLine <|>
                      try (do b <- blanklines
                              l <- indentedLine
-                             return $ b ++ l))
+                             return $ b <> l))
   optional blanklines
   classes <- getOption readerIndentedCodeClasses
   return $ return $ B.codeBlockWith ("", classes, []) $
-           stripTrailingNewlines $ concat contents
+           stripTrailingNewlines $ T.concat contents
 
 lhsCodeBlock :: PandocMonad m => MarkdownParser m (F Blocks)
 lhsCodeBlock = do
@@ -751,33 +754,33 @@ lhsCodeBlock = do
     <|> (return . B.codeBlockWith ("",["haskell"],[]) <$>
           lhsCodeBlockInverseBird)
 
-lhsCodeBlockLaTeX :: PandocMonad m => MarkdownParser m String
+lhsCodeBlockLaTeX :: PandocMonad m => MarkdownParser m Text
 lhsCodeBlockLaTeX = try $ do
   string "\\begin{code}"
   manyTill spaceChar newline
-  contents <- many1Till anyChar (try $ string "\\end{code}")
+  contents <- many1TillChar anyChar (try $ string "\\end{code}")
   blanklines
   return $ stripTrailingNewlines contents
 
-lhsCodeBlockBird :: PandocMonad m => MarkdownParser m String
+lhsCodeBlockBird :: PandocMonad m => MarkdownParser m Text
 lhsCodeBlockBird = lhsCodeBlockBirdWith '>'
 
-lhsCodeBlockInverseBird :: PandocMonad m => MarkdownParser m String
+lhsCodeBlockInverseBird :: PandocMonad m => MarkdownParser m Text
 lhsCodeBlockInverseBird = lhsCodeBlockBirdWith '<'
 
-lhsCodeBlockBirdWith :: PandocMonad m => Char -> MarkdownParser m String
+lhsCodeBlockBirdWith :: PandocMonad m => Char -> MarkdownParser m Text
 lhsCodeBlockBirdWith c = try $ do
   pos <- getPosition
   when (sourceColumn pos /= 1) $ Prelude.fail "Not in first column"
   lns <- many1 $ birdTrackLine c
   -- if (as is normal) there is always a space after >, drop it
-  let lns' = if all (\ln -> null ln || take 1 ln == " ") lns
-                then map (drop 1) lns
+  let lns' = if all (\ln -> T.null ln || T.take 1 ln == " ") lns
+                then map (T.drop 1) lns
                 else lns
   blanklines
-  return $ intercalate "\n" lns'
+  return $ T.intercalate "\n" lns'
 
-birdTrackLine :: PandocMonad m => Char -> ParserT [Char] st m String
+birdTrackLine :: PandocMonad m => Char -> ParserT Text st m Text
 birdTrackLine c = try $ do
   char c
   -- allow html tags on left margin:
@@ -791,12 +794,12 @@ birdTrackLine c = try $ do
 emailBlockQuoteStart :: PandocMonad m => MarkdownParser m Char
 emailBlockQuoteStart = try $ skipNonindentSpaces >> char '>' <* optional (char ' ')
 
-emailBlockQuote :: PandocMonad m => MarkdownParser m [String]
+emailBlockQuote :: PandocMonad m => MarkdownParser m [Text]
 emailBlockQuote = try $ do
   emailBlockQuoteStart
-  let emailLine = many $ nonEndline <|> try
-                         (endline >> notFollowedBy emailBlockQuoteStart >>
-                         return '\n')
+  let emailLine = manyChar $ nonEndline <|> try
+                              (endline >> notFollowedBy emailBlockQuoteStart >>
+                               return '\n')
   let emailSep = try (newline >> emailBlockQuoteStart)
   first <- emailLine
   rest <- many $ try $ emailSep >> emailLine
@@ -809,7 +812,7 @@ blockQuote :: PandocMonad m => MarkdownParser m (F Blocks)
 blockQuote = do
   raw <- emailBlockQuote
   -- parse the extracted block, which may contain various block elements:
-  contents <- parseFromString' parseBlocks $ intercalate "\n" raw ++ "\n\n"
+  contents <- parseFromString' parseBlocks $ T.intercalate "\n" raw <> "\n\n"
   return $ B.blockQuote <$> contents
 
 --
@@ -833,7 +836,7 @@ orderedListStart mbstydelim = try $ do
   skipNonindentSpaces
   notFollowedBy $ string "p." >> spaceChar >> digit  -- page number
   (do guardDisabled Ext_fancy_lists
-      start <- many1 digit >>= safeRead
+      start <- many1Char digit >>= safeRead
       char '.'
       gobbleSpaces 1 <|> () <$ lookAhead newline
       optional $ try (gobbleAtMostSpaces 3 >> notFollowedBy spaceChar)
@@ -857,7 +860,7 @@ orderedListStart mbstydelim = try $ do
 listStart :: PandocMonad m => MarkdownParser m ()
 listStart = bulletListStart <|> Control.Monad.void (orderedListStart Nothing)
 
-listLine :: PandocMonad m => Int -> MarkdownParser m String
+listLine :: PandocMonad m => Int -> MarkdownParser m Text
 listLine continuationIndent = try $ do
   notFollowedBy' (do gobbleSpaces continuationIndent
                      skipMany spaceChar
@@ -867,19 +870,19 @@ listLine continuationIndent = try $ do
   optional (() <$ gobbleSpaces continuationIndent)
   listLineCommon
 
-listLineCommon :: PandocMonad m => MarkdownParser m String
-listLineCommon = concat <$> manyTill
-              (  many1 (satisfy $ \c -> c `notElem` ['\n', '<', '`'])
+listLineCommon :: PandocMonad m => MarkdownParser m Text
+listLineCommon = T.concat <$> manyTill
+              (  many1Char (satisfy $ \c -> c `notElem` ['\n', '<', '`'])
              <|> fmap snd (withRaw code)
              <|> fmap snd (htmlTag isCommentTag)
-             <|> count 1 anyChar
+             <|> countChar 1 anyChar
               ) newline
 
 -- parse raw text for one list item, excluding start marker and continuations
 rawListItem :: PandocMonad m
             => Bool -- four space rule
             -> MarkdownParser m a
-            -> MarkdownParser m (String, Int)
+            -> MarkdownParser m (Text, Int)
 rawListItem fourSpaceRule start = try $ do
   pos1 <- getPosition
   start
@@ -892,14 +895,14 @@ rawListItem fourSpaceRule start = try $ do
                    notFollowedBy (() <$ codeBlockFenced)
                    notFollowedBy blankline
                    listLine continuationIndent)
-  blanks <- many blankline
-  let result = unlines (first:rest) ++ blanks
+  blanks <- manyChar blankline
+  let result = T.unlines (first:rest) <> blanks
   return (result, continuationIndent)
 
 -- continuation of a list item - indented and separated by blankline
 -- or (in compact lists) endline.
 -- note: nested lists are parsed as continuations
-listContinuation :: PandocMonad m => Int -> MarkdownParser m String
+listContinuation :: PandocMonad m => Int -> MarkdownParser m Text
 listContinuation continuationIndent = try $ do
   x <- try $ do
          notFollowedBy blankline
@@ -913,12 +916,12 @@ listContinuation continuationIndent = try $ do
          notFollowedByDivCloser
          gobbleSpaces continuationIndent <|> notFollowedBy' listStart
          anyLineNewline
-  blanks <- many blankline
-  return $ concat (x:xs) ++ blanks
+  blanks <- manyChar blankline
+  return $ T.concat (x:xs) <> blanks
 
 -- Variant of blanklines that doesn't require blank lines
 -- before a fence or eof.
-blanklines' :: PandocMonad m => MarkdownParser m [Char]
+blanklines' :: PandocMonad m => MarkdownParser m Text
 blanklines' = blanklines <|> try checkDivCloser
   where checkDivCloser = do
           guardEnabled Ext_fenced_divs
@@ -954,7 +957,7 @@ listItem fourSpaceRule start = try $ do
   (first, continuationIndent) <- rawListItem fourSpaceRule start
   continuations <- many (listContinuation continuationIndent)
   -- parse the extracted block, which may contain various block elements:
-  let raw = concat (first:continuations)
+  let raw = T.concat (first:continuations)
   contents <- parseFromString' parseBlocks raw
   updateState (\st -> st {stateParserContext = oldContext})
   exts <- getOption readerExtensions
@@ -990,7 +993,7 @@ defListMarker = do
   sps <- nonindentSpaces
   char ':' <|> char '~'
   tabStop <- getOption readerTabStop
-  let remaining = tabStop - (length sps + 1)
+  let remaining = tabStop - (T.length sps + 1)
   if remaining > 0
      then try (count remaining (char ' ')) <|> string "\t" <|> many1 spaceChar
      else mzero
@@ -1001,11 +1004,11 @@ definitionListItem compact = try $ do
   rawLine' <- anyLine
   raw <- many1 $ defRawBlock compact
   term <- parseFromString' (trimInlinesF <$> inlines) rawLine'
-  contents <- mapM (parseFromString' parseBlocks . (++"\n")) raw
+  contents <- mapM (parseFromString' parseBlocks . (<> "\n")) raw
   optional blanklines
   return $ liftM2 (,) term (sequence contents)
 
-defRawBlock :: PandocMonad m => Bool -> MarkdownParser m String
+defRawBlock :: PandocMonad m => Bool -> MarkdownParser m Text
 defRawBlock compact = try $ do
   hasBlank <- option False $ blankline >> return True
   defListMarker
@@ -1020,13 +1023,13 @@ defRawBlock compact = try $ do
                              <|> notFollowedBy defListMarker
                     anyLine )
   rawlines <- many dline
-  cont <- fmap concat $ many $ try $ do
+  cont <- fmap T.concat $ many $ try $ do
             trailing <- option "" blanklines
             ln <- indentSpaces >> notFollowedBy blankline >> anyLine
             lns <- many dline
-            return $ trailing ++ unlines (ln:lns)
-  return $ trimr (firstline ++ unlines rawlines ++ cont) ++
-            if hasBlank || not (null cont) then "\n\n" else ""
+            return $ trailing <> T.unlines (ln:lns)
+  return $ trimr (firstline <> T.unlines rawlines <> cont) <>
+            if hasBlank || not (T.null cont) then "\n\n" else ""
 
 definitionList :: PandocMonad m => MarkdownParser m (F Blocks)
 definitionList = try $ do
@@ -1063,7 +1066,7 @@ para = try $ do
                  | not (null alt) ->
                     -- the fig: at beginning of title indicates a figure
                     return $ B.singleton
-                           $ Image attr alt (src,'f':'i':'g':':':tit)
+                           $ Image attr alt (src, "fig:" <> tit)
                _ -> return x'
        | otherwise = x
   result <- implicitFigures . trimInlinesF <$> inlines1
@@ -1082,7 +1085,7 @@ para = try $ do
                      inHtmlBlock <- stateInHtmlBlock <$> getState
                      case inHtmlBlock of
                           Just "div" -> () <$
-                                       lookAhead (htmlTag (~== TagClose "div"))
+                                       lookAhead (htmlTag (~== TagClose ("div" :: Text)))
                           _          -> mzero
               <|> do guardEnabled Ext_fenced_divs
                      divLevel <- stateFencedDivLevel <$> getState
@@ -1098,7 +1101,7 @@ plain = fmap B.plain . trimInlinesF <$> inlines1
 -- raw html
 --
 
-htmlElement :: PandocMonad m => MarkdownParser m String
+htmlElement :: PandocMonad m => MarkdownParser m Text
 htmlElement = rawVerbatimBlock
           <|> strictHtmlBlock
           <|> fmap snd (htmlTag isBlockTag)
@@ -1132,14 +1135,14 @@ htmlBlock' = try $ do
     first <- htmlElement
     skipMany spaceChar
     optional blanklines
-    return $ if null first
+    return $ if T.null first
                 then mempty
                 else return $ B.rawBlock "html" first
 
-strictHtmlBlock :: PandocMonad m => MarkdownParser m String
+strictHtmlBlock :: PandocMonad m => MarkdownParser m Text
 strictHtmlBlock = htmlInBalanced (not . isInlineTag)
 
-rawVerbatimBlock :: PandocMonad m => MarkdownParser m String
+rawVerbatimBlock :: PandocMonad m => MarkdownParser m Text
 rawVerbatimBlock = htmlInBalanced isVerbTag
   where isVerbTag (TagOpen "pre" _)      = True
         isVerbTag (TagOpen "style" _)    = True
@@ -1150,13 +1153,13 @@ rawVerbatimBlock = htmlInBalanced isVerbTag
 rawTeXBlock :: PandocMonad m => MarkdownParser m (F Blocks)
 rawTeXBlock = do
   guardEnabled Ext_raw_tex
-  result <- (B.rawBlock "tex" . trim . concat <$>
-                many1 ((++) <$> rawConTeXtEnvironment <*> spnl'))
-          <|> (B.rawBlock "tex" . trim . concat <$>
-                many1 ((++) <$> rawLaTeXBlock <*> spnl'))
+  result <- (B.rawBlock "tex" . trim . T.concat <$>
+                many1 ((<>) <$> rawConTeXtEnvironment <*> spnl'))
+          <|> (B.rawBlock "tex" . trim . T.concat <$>
+                many1 ((<>) <$> rawLaTeXBlock <*> spnl'))
   return $ case B.toList result of
                 [RawBlock _ cs]
-                  | all (`elem` [' ','\t','\n']) cs -> return mempty
+                  | T.all (`elem` [' ','\t','\n']) cs -> return mempty
                 -- don't create a raw block for suppressed macro defs
                 _ -> return result
 
@@ -1186,7 +1189,7 @@ rawHtmlBlocks = do
   return result
 
 -- remove markdown="1" attribute
-stripMarkdownAttribute :: String -> String
+stripMarkdownAttribute :: Text -> Text
 stripMarkdownAttribute s = renderTags' $ map filterAttrib $ parseTags s
   where filterAttrib (TagOpen t as) = TagOpen t
                                         [(k,v) | (k,v) <- as, k /= "markdown"]
@@ -1211,7 +1214,7 @@ lineBlock = try $ do
 -- and the length including trailing space.
 dashedLine :: PandocMonad m
            => Char
-           -> ParserT [Char] st m (Int, Int)
+           -> ParserT Text st m (Int, Int)
 dashedLine ch = do
   dashes <- many1 (char ch)
   sp     <- many spaceChar
@@ -1232,9 +1235,9 @@ simpleTableHeader headless = try $ do
   dashes      <- many1 (dashedLine '-')
   newline
   let (lengths, lines') = unzip dashes
-  let indices  = scanl (+) (length initSp) lines'
+  let indices  = scanl (+) (T.length initSp) lines'
   -- If no header, calculate alignment on basis of first row of text
-  rawHeads <- fmap (tail . splitStringByIndices (init indices)) $
+  rawHeads <- fmap (tail . splitTextByIndices (init indices)) $
               if headless
                  then lookAhead anyLine
                  else return rawContent
@@ -1250,15 +1253,15 @@ simpleTableHeader headless = try $ do
 -- Returns an alignment type for a table, based on a list of strings
 -- (the rows of the column header) and a number (the length of the
 -- dashed line under the rows.
-alignType :: [String]
+alignType :: [Text]
           -> Int
           -> Alignment
 alignType [] _ = AlignDefault
 alignType strLst len =
-  let nonempties = filter (not . null) $ map trimr strLst
+  let nonempties = filter (not . T.null) $ map trimr strLst
       (leftSpace, rightSpace) =
-           case sortBy (comparing length) nonempties of
-                 (x:_) -> (head x `elem` " \t", length x < len)
+           case sortBy (comparing T.length) nonempties of
+                 (x:_) -> (T.head x `elem` [' ', 't'], T.length x < len)
                  []    -> (False, False)
   in  case (leftSpace, rightSpace) of
         (True,  False) -> AlignRight
@@ -1267,7 +1270,7 @@ alignType strLst len =
         (False, False) -> AlignDefault
 
 -- Parse a table footer - dashed lines followed by blank line.
-tableFooter :: PandocMonad m => MarkdownParser m String
+tableFooter :: PandocMonad m => MarkdownParser m Text
 tableFooter = try $ skipNonindentSpaces >> many1 (dashedLine '-') >> blanklines'
 
 -- Parse a table separator - dashed line.
@@ -1277,12 +1280,12 @@ tableSep = try $ skipNonindentSpaces >> many1 (dashedLine '-') >> char '\n'
 -- Parse a raw line and split it into chunks by indices.
 rawTableLine :: PandocMonad m
              => [Int]
-             -> MarkdownParser m [String]
+             -> MarkdownParser m [Text]
 rawTableLine indices = do
   notFollowedBy' (blanklines' <|> tableFooter)
-  line <- many1Till anyChar newline
+  line <- many1TillChar anyChar newline
   return $ map trim $ tail $
-           splitStringByIndices (init indices) line
+           splitTextByIndices (init indices) line
 
 -- Parse a table line and return a list of lists of blocks (columns).
 tableLine :: PandocMonad m
@@ -1297,7 +1300,7 @@ multilineRow :: PandocMonad m
              -> MarkdownParser m (F [Blocks])
 multilineRow indices = do
   colLines <- many1 (rawTableLine indices)
-  let cols = map unlines $ transpose colLines
+  let cols = map T.unlines $ transpose colLines
   fmap sequence $ mapM (parseFromString' (mconcat <$> many plain)) cols
 
 -- Parses a table caption:  inlines beginning with 'Table:'
@@ -1344,7 +1347,7 @@ multilineTableHeader headless = try $ do
   dashes      <- many1 (dashedLine '-')
   newline
   let (lengths, lines') = unzip dashes
-  let indices  = scanl (+) (length initSp) lines'
+  let indices  = scanl (+) (T.length initSp) lines'
   -- compensate for the fact that intercolumn spaces are
   -- not included in the last index:
   let indices' = case reverse indices of
@@ -1352,14 +1355,14 @@ multilineTableHeader headless = try $ do
                       (x:xs) -> reverse (x+1:xs)
   rawHeadsList <- if headless
                      then fmap (map (:[]) . tail .
-                              splitStringByIndices (init indices')) $ lookAhead anyLine
+                              splitTextByIndices (init indices')) $ lookAhead anyLine
                      else return $ transpose $ map
-                           (tail . splitStringByIndices (init indices'))
+                           (tail . splitTextByIndices (init indices'))
                            rawContent
   let aligns   = zipWith alignType rawHeadsList lengths
   let rawHeads = if headless
                     then replicate (length dashes) ""
-                    else map (unlines . map trim) rawHeadsList
+                    else map (T.unlines . map trim) rawHeadsList
   heads <- fmap sequence $
             mapM ((parseFromString' (mconcat <$> many plain)).trim) rawHeads
   return (heads, aligns, indices')
@@ -1393,7 +1396,7 @@ pipeTable = try $ do
   lines' <- many pipeTableRow
   let lines'' = map (take (length aligns) <$>) lines'
   let maxlength = maximum $
-       map (\x -> length . stringify $ runF x def) (heads' : lines'')
+       map (\x -> T.length . stringify $ runF x def) (heads' : lines'')
   numColumns <- getOption readerColumns
   let widths = if maxlength > numColumns
                   then map (\len ->
@@ -1430,7 +1433,7 @@ pipeTableCell =
       return $ B.plain <$> result)
     <|> return mempty
 
-pipeTableHeaderPart :: PandocMonad m => ParserT [Char] st m (Alignment, Int)
+pipeTableHeaderPart :: PandocMonad m => ParserT Text st m (Alignment, Int)
 pipeTableHeaderPart = try $ do
   skipMany spaceChar
   left <- optionMaybe (char ':')
@@ -1446,12 +1449,12 @@ pipeTableHeaderPart = try $ do
       (Just _,Just _)   -> AlignCenter, len)
 
 -- Succeed only if current line contains a pipe.
-scanForPipe :: PandocMonad m => ParserT [Char] st m ()
+scanForPipe :: PandocMonad m => ParserT Text st m ()
 scanForPipe = do
   inp <- getInput
-  case break (\c -> c == '\n' || c == '|') inp of
-       (_,'|':_) -> return ()
-       _         -> mzero
+  case T.break (\c -> c == '\n' || c == '|') inp of
+       (_, T.uncons -> Just ('|', _)) -> return ()
+       _                              -> mzero
 
 -- | Parse a table using 'headerParser', 'rowParser',
 -- 'lineParser', and 'footerParser'.  Variant of the version in
@@ -1561,7 +1564,7 @@ escapedChar = do
   result <- escapedChar'
   case result of
        ' ' -> return $ return $ B.str "\160" -- "\ " is a nonbreaking space
-       _   -> return $ return $ B.str [result]
+       _   -> return $ return $ B.str $ T.singleton result
 
 ltSign :: PandocMonad m => MarkdownParser m (F Inlines)
 ltSign = do
@@ -1574,12 +1577,12 @@ exampleRef :: PandocMonad m => MarkdownParser m (F Inlines)
 exampleRef = try $ do
   guardEnabled Ext_example_lists
   char '@'
-  lab <- many1 (alphaNum <|> oneOf "-_")
+  lab <- many1Char (alphaNum <|> oneOf "-_")
   return $ do
     st <- askF
     return $ case M.lookup lab (stateExamples st) of
-                  Just n  -> B.str (show n)
-                  Nothing -> B.str ('@':lab)
+                  Just n  -> B.str $ tshow n
+                  Nothing -> B.str $ "@" <> lab
 
 symbol :: PandocMonad m => MarkdownParser m (F Inlines)
 symbol = do
@@ -1587,16 +1590,16 @@ symbol = do
          <|> try (do lookAhead $ char '\\'
                      notFollowedBy' (() <$ rawTeXBlock)
                      char '\\')
-  return $ return $ B.str [result]
+  return $ return $ B.str $ T.singleton result
 
 -- parses inline code, between n `s and n `s
 code :: PandocMonad m => MarkdownParser m (F Inlines)
 code = try $ do
   starts <- many1 (char '`')
   skipSpaces
-  result <- (trim . concat) <$>
+  result <- (trim . T.concat) <$>
             manyTill (notFollowedBy (inList >> listStart) >>
-                      (many1 (noneOf "`\n") <|> many1 (char '`') <|>
+                      (many1Char (noneOf "`\n") <|> many1Char (char '`') <|>
                        (char '\n' >> notFollowedBy' blankline >> return " ")))
                       (try (skipSpaces >> count (length starts) (char '`') >>
                       notFollowedBy (char '`')))
@@ -1627,10 +1630,10 @@ enclosure c = do
   guardDisabled Ext_intraword_underscores
     <|> guard (c == '*')
     <|> (guard =<< notAfterString)
-  cs <- many1 (char c)
+  cs <- many1Char (char c)
   (return (B.str cs) <>) <$> whitespace
     <|>
-        case length cs of
+        case T.length cs of
              3 -> three c
              2 -> two   c mempty
              1 -> one   c mempty
@@ -1653,7 +1656,7 @@ three c = do
   (ender c 3 >> updateLastStrPos >> return ((B.strong . B.emph) <$> contents))
     <|> (ender c 2 >> updateLastStrPos >> one c (B.strong <$> contents))
     <|> (ender c 1 >> updateLastStrPos >> two c (B.emph <$> contents))
-    <|> return (return (B.str [c,c,c]) <> contents)
+    <|> return (return (B.str $ T.pack [c,c,c]) <> contents)
 
 -- Parse inlines til you hit two c's, and emit strong.
 -- If you never do hit two cs, emit ** plus inlines parsed.
@@ -1662,7 +1665,7 @@ two c prefix' = do
   contents <- mconcat <$> many (try $ notFollowedBy (ender c 2) >> inline)
   (ender c 2 >> updateLastStrPos >>
                 return (B.strong <$> (prefix' <> contents)))
-    <|> return (return (B.str [c,c]) <> (prefix' <> contents))
+    <|> return (return (B.str $ T.pack [c,c]) <> (prefix' <> contents))
 
 -- Parse inlines til you hit a c, and emit emph.
 -- If you never hit a c, emit * plus inlines parsed.
@@ -1673,7 +1676,7 @@ one c prefix' = do
                                     notFollowedBy (ender c 1) >>
                                     two c mempty) )
   (ender c 1 >> updateLastStrPos >> return (B.emph <$> (prefix' <> contents)))
-    <|> return (return (B.str [c]) <> (prefix' <> contents))
+    <|> return (return (B.str $ T.singleton c) <> (prefix' <> contents))
 
 strongOrEmph :: PandocMonad m => MarkdownParser m (F Inlines)
 strongOrEmph =  enclosure '*' <|> enclosure '_'
@@ -1717,16 +1720,16 @@ whitespace = spaceChar >> return <$> (lb <|> regsp) <?> "whitespace"
   where lb = spaceChar >> skipMany spaceChar >> option B.space (endline >> return B.linebreak)
         regsp = skipMany spaceChar >> return B.space
 
-nonEndline :: PandocMonad m => ParserT [Char] st m Char
+nonEndline :: PandocMonad m => ParserT Text st m Char
 nonEndline = satisfy (/='\n')
 
 str :: PandocMonad m => MarkdownParser m (F Inlines)
 str = do
-  result <- many1 (alphaNum <|> try (char '.' <* notFollowedBy (char '.')))
+  result <- many1Char (alphaNum <|> try (char '.' <* notFollowedBy (char '.')))
   updateLastStrPos
   (do guardEnabled Ext_smart
       abbrevs <- getOption readerAbbreviations
-      if not (null result) && last result == '.' && result `Set.member` abbrevs
+      if not (T.null result) && T.last result == '.' && result `Set.member` abbrevs
          then try (do ils <- whitespace
                       -- ?? lookAhead alphaNum
                       -- replace space after with nonbreaking space
@@ -1766,36 +1769,36 @@ endline = try $ do
 --
 
 -- a reference label for a link
-reference :: PandocMonad m => MarkdownParser m (F Inlines, String)
+reference :: PandocMonad m => MarkdownParser m (F Inlines, Text)
 reference = do
   guardDisabled Ext_footnotes <|> notFollowedBy' (string "[^")
   guardDisabled Ext_citations <|> notFollowedBy' (string "[@")
   withRaw $ trimInlinesF <$> inlinesInBalancedBrackets
 
-parenthesizedChars :: PandocMonad m => MarkdownParser m [Char]
+parenthesizedChars :: PandocMonad m => MarkdownParser m Text
 parenthesizedChars = do
   result <- charsInBalanced '(' ')' litChar
-  return $ '(' : result ++ ")"
+  return $ "(" <> result <> ")"
 
 -- source for a link, with optional title
-source :: PandocMonad m => MarkdownParser m (String, String)
+source :: PandocMonad m => MarkdownParser m (Text, Text)
 source = do
   char '('
   skipSpaces
   let urlChunk =
             try parenthesizedChars
-        <|> (notFollowedBy (oneOf " )") >> count 1 litChar)
-        <|> try (many1 spaceChar <* notFollowedBy (oneOf "\"')"))
-  let sourceURL = (unwords . words . concat) <$> many urlChunk
+        <|> (notFollowedBy (oneOf " )") >> countChar 1 litChar)
+        <|> try (many1Char spaceChar <* notFollowedBy (oneOf "\"')"))
+  let sourceURL = (T.unwords . T.words . T.concat) <$> many urlChunk
   let betweenAngles = try $
-         char '<' >> manyTill litChar (char '>')
+         char '<' >> manyTillChar litChar (char '>')
   src <- try betweenAngles <|> sourceURL
   tit <- option "" $ try $ spnl >> linkTitle
   skipSpaces
   char ')'
   return (escapeURI $ trimr src, tit)
 
-linkTitle :: PandocMonad m => MarkdownParser m String
+linkTitle :: PandocMonad m => MarkdownParser m Text
 linkTitle = quotedTitle '"' <|> quotedTitle '\''
 
 link :: PandocMonad m => MarkdownParser m (F Inlines)
@@ -1823,13 +1826,13 @@ isSmallCaps :: Attr -> Bool
 isSmallCaps ("",["smallcaps"],[]) = True
 isSmallCaps ("",[],kvs) =
   case lookup "style" kvs of
-       Just s -> map toLower (filter (`notElem` " \t;") s) ==
+       Just s -> T.toLower (T.filter (`notElem` [' ', '\t', ';']) s) ==
                     "font-variant:small-caps"
        Nothing -> False
 isSmallCaps _ = False
 
 regLink :: PandocMonad m
-        => (Attr -> String -> String -> Inlines -> Inlines)
+        => (Attr -> Text -> Text -> Inlines -> Inlines)
         -> F Inlines
         -> MarkdownParser m (F Inlines)
 regLink constructor lab = try $ do
@@ -1840,8 +1843,8 @@ regLink constructor lab = try $ do
 
 -- a link like [this][ref] or [this][] or [this]
 referenceLink :: PandocMonad m
-              => (Attr -> String -> String -> Inlines -> Inlines)
-              -> (F Inlines, String)
+              => (Attr -> Text -> Text -> Inlines -> Inlines)
+              -> (F Inlines, Text)
               -> MarkdownParser m (F Inlines)
 referenceLink constructor (lab, raw) = do
   sp <- (True <$ lookAhead (char ' ')) <|> return False
@@ -1863,7 +1866,7 @@ referenceLink constructor (lab, raw) = do
        parsedRaw' <- parsedRaw
        fallback' <- fallback
        return $ B.str "[" <> fallback' <> B.str "]" <>
-                (if sp && not (null raw) then B.space else mempty) <>
+                (if sp && not (T.null raw) then B.space else mempty) <>
                 parsedRaw'
   return $ do
     keys <- asksF stateKeys
@@ -1878,19 +1881,19 @@ referenceLink constructor (lab, raw) = do
             else makeFallback
        Just ((src,tit), attr) -> constructor attr src tit <$> lab
 
-dropBrackets :: String -> String
-dropBrackets = reverse . dropRB . reverse . dropLB
-  where dropRB (']':xs) = xs
-        dropRB xs       = xs
-        dropLB ('[':xs) = xs
-        dropLB xs       = xs
+dropBrackets :: Text -> Text
+dropBrackets = dropRB . dropLB
+  where dropRB (T.unsnoc -> Just (xs,']')) = xs
+        dropRB xs                          = xs
+        dropLB (T.uncons -> Just ('[',xs)) = xs
+        dropLB xs                          = xs
 
 bareURL :: PandocMonad m => MarkdownParser m (F Inlines)
 bareURL = try $ do
   guardEnabled Ext_autolink_bare_uris
   getState >>= guard . stateAllowLinks
   (cls, (orig, src)) <- (("uri",) <$> uri) <|> (("email",) <$> emailAddress)
-  notFollowedBy $ try $ spaces >> htmlTag (~== TagClose "a")
+  notFollowedBy $ try $ spaces >> htmlTag (~== TagClose ("a" :: Text))
   return $ return $ B.linkWith ("",[cls],[]) src "" (B.str orig)
 
 autoLink :: PandocMonad m => MarkdownParser m (F Inlines)
@@ -1902,19 +1905,20 @@ autoLink = try $ do
   -- is finished, because the uri parser tries to avoid parsing
   -- final punctuation.  for example:  in `<http://hi---there>`,
   -- the URI parser will stop before the dashes.
-  extra <- fromEntities <$> manyTill nonspaceChar (char '>')
+  extra <- fromEntities <$> manyTillChar nonspaceChar (char '>')
   attr  <- option ("", [cls], []) $ try $
             guardEnabled Ext_link_attributes >> attributes
-  return $ return $ B.linkWith attr (src ++ escapeURI extra) ""
-                     (B.str $ orig ++ extra)
+  return $ return $ B.linkWith attr (src <> escapeURI extra) ""
+                     (B.str $ orig <> extra)
 
 image :: PandocMonad m => MarkdownParser m (F Inlines)
 image = try $ do
   char '!'
   (lab,raw) <- reference
   defaultExt <- getOption readerDefaultImageExtension
-  let constructor attr' src = case takeExtension src of
-                          "" -> B.imageWith attr' (addExtension src defaultExt)
+  let constructor attr' src = case takeExtension (T.unpack src) of
+                          "" -> B.imageWith attr' (T.pack $ addExtension (T.unpack src)
+                                                          $ T.unpack defaultExt)
                           _  -> B.imageWith attr' src
   regLink constructor lab <|> referenceLink constructor (lab,raw)
 
@@ -1926,7 +1930,7 @@ note = try $ do
   return $ do
     notes <- asksF stateNotes'
     case M.lookup ref notes of
-        Nothing       -> return $ B.str $ "[^" ++ ref ++ "]"
+        Nothing       -> return $ B.str $ "[^" <> ref <> "]"
         Just (_pos, contents) -> do
           st <- askF
           -- process the note in a context that doesn't resolve
@@ -1949,29 +1953,29 @@ rawLaTeXInline' = try $ do
   s <- rawLaTeXInline
   return $ return $ B.rawInline "tex" s -- "tex" because it might be context
 
-rawConTeXtEnvironment :: PandocMonad m => ParserT [Char] st m String
+rawConTeXtEnvironment :: PandocMonad m => ParserT Text st m Text
 rawConTeXtEnvironment = try $ do
   string "\\start"
   completion <- inBrackets (letter <|> digit <|> spaceChar)
-               <|> many1 letter
-  contents <- manyTill (rawConTeXtEnvironment <|> count 1 anyChar)
-                       (try $ string "\\stop" >> string completion)
-  return $ "\\start" ++ completion ++ concat contents ++ "\\stop" ++ completion
+               <|> many1Char letter
+  contents <- manyTill (rawConTeXtEnvironment <|> countChar 1 anyChar)
+                       (try $ string "\\stop" >> textStr completion)
+  return $ "\\start" <> completion <> T.concat contents <> "\\stop" <> completion
 
-inBrackets :: PandocMonad m => ParserT [Char] st m Char -> ParserT [Char] st m String
+inBrackets :: PandocMonad m => ParserT Text st m Char -> ParserT Text st m Text
 inBrackets parser = do
   char '['
-  contents <- many parser
+  contents <- manyChar parser
   char ']'
-  return $ "[" ++ contents ++ "]"
+  return $ "[" <> contents <> "]"
 
 spanHtml :: PandocMonad m => MarkdownParser m (F Inlines)
 spanHtml = try $ do
   guardEnabled Ext_native_spans
-  (TagOpen _ attrs, _) <- htmlTag (~== TagOpen "span" [])
-  contents <- mconcat <$> manyTill inline (htmlTag (~== TagClose "span"))
+  (TagOpen _ attrs, _) <- htmlTag (~== TagOpen ("span" :: Text) [])
+  contents <- mconcat <$> manyTill inline (htmlTag (~== TagClose ("span" :: Text)))
   let ident = fromMaybe "" $ lookup "id" attrs
-  let classes = maybe [] words $ lookup "class" attrs
+  let classes = maybe [] T.words $ lookup "class" attrs
   let keyvals = [(k,v) | (k,v) <- attrs, k /= "id" && k /= "class"]
   return $ if isSmallCaps (ident, classes, keyvals)
               then B.smallcaps <$> contents
@@ -1980,20 +1984,20 @@ spanHtml = try $ do
 divHtml :: PandocMonad m => MarkdownParser m (F Blocks)
 divHtml = try $ do
   guardEnabled Ext_native_divs
-  (TagOpen _ attrs, rawtag) <- htmlTag (~== TagOpen "div" [])
+  (TagOpen _ attrs, rawtag) <- htmlTag (~== TagOpen ("div" :: Text) [])
   -- we set stateInHtmlBlock so that closing tags that can be either block or
   -- inline will not be parsed as inline tags
   oldInHtmlBlock <- stateInHtmlBlock <$> getState
   updateState $ \st -> st{ stateInHtmlBlock = Just "div" }
   bls <- option "" (blankline >> option "" blanklines)
   contents <- mconcat <$>
-              many (notFollowedBy' (htmlTag (~== TagClose "div")) >> block)
-  closed <- option False (True <$ htmlTag (~== TagClose "div"))
+              many (notFollowedBy' (htmlTag (~== TagClose ("div" :: Text))) >> block)
+  closed <- option False (True <$ htmlTag (~== TagClose ("div" :: Text)))
   if closed
      then do
        updateState $ \st -> st{ stateInHtmlBlock = oldInHtmlBlock }
        let ident = fromMaybe "" $ lookup "id" attrs
-       let classes = maybe [] words $ lookup "class" attrs
+       let classes = maybe [] T.words $ lookup "class" attrs
        let keyvals = [(k,v) | (k,v) <- attrs, k /= "id" && k /= "class"]
        return $ B.divWith (ident, classes, keyvals) <$> contents
      else -- avoid backtracing
@@ -2005,7 +2009,7 @@ divFenced = try $ do
   string ":::"
   skipMany (char ':')
   skipMany spaceChar
-  attribs <- attributes <|> ((\x -> ("",[x],[])) <$> many1 nonspaceChar)
+  attribs <- attributes <|> ((\x -> ("",[x],[])) <$> many1Char nonspaceChar)
   skipMany spaceChar
   skipMany (char ':')
   blankline
@@ -2047,7 +2051,7 @@ emoji :: PandocMonad m => MarkdownParser m (F Inlines)
 emoji = try $ do
   guardEnabled Ext_emoji
   char ':'
-  emojikey <- many1 (oneOf emojiChars)
+  emojikey <- many1Char (oneOf emojiChars)
   char ':'
   case emojiToInline emojikey of
     Just i -> return (return $ B.singleton i)
@@ -2077,14 +2081,14 @@ textualCite = try $ do
   mbrest <- option Nothing $ try $ spnl >> Just <$> withRaw normalCite
   case mbrest of
        Just (rest, raw) ->
-         return $ (flip B.cite (B.text $ '@':key ++ " " ++ raw) . (first:))
+         return $ (flip B.cite (B.text $ "@" <> key <> " " <> raw) . (first:))
                <$> rest
        Nothing   ->
          (do
           (cs, raw) <- withRaw $ bareloc first
-          let (spaces',raw') = span isSpace raw
-              spc | null spaces' = mempty
-                  | otherwise    = B.space
+          let (spaces',raw') = T.span isSpace raw
+              spc | T.null spaces' = mempty
+                  | otherwise      = B.space
           lab <- parseFromString' inlines $ dropBrackets raw'
           fallback <- referenceLink B.linkWith (lab,raw')
           return $ do
@@ -2092,12 +2096,12 @@ textualCite = try $ do
             cs' <- cs
             return $
               case B.toList fallback' of
-                Link{}:_ -> B.cite [first] (B.str $ '@':key) <> spc <> fallback'
-                _        -> B.cite cs' (B.text $ '@':key ++ " " ++ raw))
+                Link{}:_ -> B.cite [first] (B.str $ "@" <> key) <> spc <> fallback'
+                _        -> B.cite cs' (B.text $ "@" <> key <> " " <> raw))
          <|> return (do st <- askF
                         return $ case M.lookup key (stateExamples st) of
-                                 Just n -> B.str (show n)
-                                 _      -> B.cite [first] $ B.str $ '@':key)
+                                 Just n -> B.str $ tshow n
+                                 _      -> B.cite [first] $ B.str $ "@" <> key)
 
 bareloc :: PandocMonad m => Citation -> MarkdownParser m (F [Citation])
 bareloc c = try $ do