miniflux/reader/rss/rss.go

// Copyright 2017 Frédéric Guillot. All rights reserved.
// Use of this source code is governed by the Apache 2.0
// license that can be found in the LICENSE file.

package rss // import "miniflux.app/reader/rss"

import (
	"encoding/xml"
	"html"
	"path"
	"strconv"
	"strings"
	"time"

	"miniflux.app/crypto"
	"miniflux.app/logger"
	"miniflux.app/model"
	"miniflux.app/reader/date"
	"miniflux.app/reader/media"
	"miniflux.app/reader/sanitizer"
	"miniflux.app/url"
)

// Specs: https://cyber.harvard.edu/rss/rss.html
type rssFeed struct {
	XMLName        xml.Name  `xml:"rss"`
	Version        string    `xml:"version,attr"`
	Title          string    `xml:"channel>title"`
	Links          []rssLink `xml:"channel>link"`
	Language       string    `xml:"channel>language"`
	Description    string    `xml:"channel>description"`
	PubDate        string    `xml:"channel>pubDate"`
	ManagingEditor string    `xml:"channel>managingEditor"`
	Webmaster      string    `xml:"channel>webMaster"`
	Items          []rssItem `xml:"channel>item"`
	PodcastFeedElement
}

func (r *rssFeed) Transform(baseURL string) *model.Feed {
	var err error

	feed := new(model.Feed)

	siteURL := r.siteURL()
	feed.SiteURL, err = url.AbsoluteURL(baseURL, siteURL)
	if err != nil {
		feed.SiteURL = siteURL
	}

	feedURL := r.feedURL()
	feed.FeedURL, err = url.AbsoluteURL(baseURL, feedURL)
	if err != nil {
		feed.FeedURL = feedURL
	}

	feed.Title = strings.TrimSpace(r.Title)
	if feed.Title == "" {
		feed.Title = feed.SiteURL
	}

	for _, item := range r.Items {
		entry := item.Transform()
		if entry.Author == "" {
			entry.Author = r.feedAuthor()
		}

		if entry.URL == "" {
			entry.URL = feed.SiteURL
		} else {
			entryURL, err := url.AbsoluteURL(feed.SiteURL, entry.URL)
			if err == nil {
				entry.URL = entryURL
			}
		}

		if entry.Title == "" {
			entry.Title = entry.URL
		}

		feed.Entries = append(feed.Entries, entry)
	}

	return feed
}

func (r *rssFeed) siteURL() string {
	for _, element := range r.Links {
		if element.XMLName.Space == "" {
			return strings.TrimSpace(element.Data)
		}
	}

	return ""
}

func (r *rssFeed) feedURL() string {
	for _, element := range r.Links {
		if element.XMLName.Space == "http://www.w3.org/2005/Atom" {
			return strings.TrimSpace(element.Href)
		}
	}

	return ""
}

func (r rssFeed) feedAuthor() string {
	author := r.PodcastAuthor()
	switch {
	case r.ManagingEditor != "":
		author = r.ManagingEditor
	case r.Webmaster != "":
		author = r.Webmaster
	}
	return sanitizer.StripTags(strings.TrimSpace(author))
}

type rssLink struct {
	XMLName xml.Name
	Data    string `xml:",chardata"`
	Href    string `xml:"href,attr"`
	Rel     string `xml:"rel,attr"`
}

type rssCommentLink struct {
	XMLName xml.Name
	Data    string `xml:",chardata"`
}

type rssAuthor struct {
	XMLName xml.Name
	Data    string `xml:",chardata"`
	Name    string `xml:"name"`
	Email   string `xml:"email"`
	Inner   string `xml:",innerxml"`
}

type rssTitle struct {
	XMLName xml.Name
	Data    string `xml:",chardata"`
	Inner   string `xml:",innerxml"`
}

type rssEnclosure struct {
	URL    string `xml:"url,attr"`
	Type   string `xml:"type,attr"`
	Length string `xml:"length,attr"`
}

func (enclosure *rssEnclosure) Size() int64 {
	if enclosure.Length == "" {
		return 0
	}
	size, _ := strconv.ParseInt(enclosure.Length, 10, 0)
	return size
}

type rssItem struct {
	GUID           string           `xml:"guid"`
	Title          []rssTitle       `xml:"title"`
	Links          []rssLink        `xml:"link"`
	Description    string           `xml:"description"`
	PubDate        string           `xml:"pubDate"`
	Authors        []rssAuthor      `xml:"author"`
	CommentLinks   []rssCommentLink `xml:"comments"`
	EnclosureLinks []rssEnclosure   `xml:"enclosure"`
	DublinCoreElement
	FeedBurnerElement
	PodcastEntryElement
	media.Element
}

func (r *rssItem) Transform() *model.Entry {
	entry := new(model.Entry)
	entry.URL = r.entryURL()
	entry.CommentsURL = r.entryCommentsURL()
	entry.Date = r.entryDate()
	entry.Author = r.entryAuthor()
	entry.Hash = r.entryHash()
	entry.Content = r.entryContent()
	entry.Title = r.entryTitle()
	entry.Enclosures = r.entryEnclosures()
	return entry
}

func (r *rssItem) entryDate() time.Time {
	value := r.PubDate
	if r.DublinCoreDate != "" {
		value = r.DublinCoreDate
	}

	if value != "" {
		result, err := date.Parse(value)
		if err != nil {
			logger.Error("rss: %v (entry GUID = %s)", err, r.GUID)
			return time.Now()
		}

		return result
	}

	return time.Now()
}

func (r *rssItem) entryAuthor() string {
	author := ""

	for _, rssAuthor := range r.Authors {
		switch rssAuthor.XMLName.Space {
		case "http://www.itunes.com/dtds/podcast-1.0.dtd", "http://www.google.com/schemas/play-podcasts/1.0":
			author = rssAuthor.Data
		case "http://www.w3.org/2005/Atom":
			if rssAuthor.Name != "" {
				author = rssAuthor.Name
			} else if rssAuthor.Email != "" {
				author = rssAuthor.Email
			}
		default:
			if rssAuthor.Name != "" {
				author = rssAuthor.Name
			} else {
				author = rssAuthor.Inner
			}
		}
	}

	if author == "" {
		author = r.DublinCoreCreator
	}

	return sanitizer.StripTags(strings.TrimSpace(author))
}

func (r *rssItem) entryHash() string {
	for _, value := range []string{r.GUID, r.entryURL()} {
		if value != "" {
			return crypto.Hash(value)
		}
	}

	return ""
}

func (r *rssItem) entryTitle() string {
	var title string

	for _, rssTitle := range r.Title {
		switch rssTitle.XMLName.Space {
		case "http://search.yahoo.com/mrss/":
			// Ignore title in media namespace
		case "http://purl.org/dc/elements/1.1/":
			title = rssTitle.Data
		default:
			title = rssTitle.Data
		}

		if title != "" {
			break
		}
	}

	return html.UnescapeString(strings.TrimSpace(title))
}

func (r *rssItem) entryContent() string {
	for _, value := range []string{r.DublinCoreContent, r.Description, r.PodcastDescription()} {
		if value != "" {
			return value
		}
	}
	return ""
}

func (r *rssItem) entryURL() string {
	if r.FeedBurnerLink != "" {
		return r.FeedBurnerLink
	}

	for _, link := range r.Links {
		if link.XMLName.Space == "http://www.w3.org/2005/Atom" && link.Href != "" && isValidLinkRelation(link.Rel) {
			return strings.TrimSpace(link.Href)
		}

		if link.Data != "" {
			return strings.TrimSpace(link.Data)
		}
	}

	return ""
}

func (r *rssItem) entryEnclosures() model.EnclosureList {
	enclosures := make(model.EnclosureList, 0)
	duplicates := make(map[string]bool, 0)

	for _, mediaThumbnail := range r.AllMediaThumbnails() {
		if _, found := duplicates[mediaThumbnail.URL]; !found {
			duplicates[mediaThumbnail.URL] = true
			enclosures = append(enclosures, &model.Enclosure{
				URL:      mediaThumbnail.URL,
				MimeType: mediaThumbnail.MimeType(),
				Size:     mediaThumbnail.Size(),
			})
		}
	}

	for _, enclosure := range r.EnclosureLinks {
		enclosureURL := enclosure.URL

		if r.FeedBurnerEnclosureLink != "" {
			filename := path.Base(r.FeedBurnerEnclosureLink)
			if strings.Contains(enclosureURL, filename) {
				enclosureURL = r.FeedBurnerEnclosureLink
			}
		}

		if enclosureURL == "" {
			continue
		}

		if _, found := duplicates[enclosureURL]; !found {
			duplicates[enclosureURL] = true

			enclosures = append(enclosures, &model.Enclosure{
				URL:      enclosureURL,
				MimeType: enclosure.Type,
				Size:     enclosure.Size(),
			})
		}
	}

	for _, mediaContent := range r.AllMediaContents() {
		if _, found := duplicates[mediaContent.URL]; !found {
			duplicates[mediaContent.URL] = true
			enclosures = append(enclosures, &model.Enclosure{
				URL:      mediaContent.URL,
				MimeType: mediaContent.MimeType(),
				Size:     mediaContent.Size(),
			})
		}
	}

	for _, mediaPeerLink := range r.AllMediaPeerLinks() {
		if _, found := duplicates[mediaPeerLink.URL]; !found {
			duplicates[mediaPeerLink.URL] = true
			enclosures = append(enclosures, &model.Enclosure{
				URL:      mediaPeerLink.URL,
				MimeType: mediaPeerLink.MimeType(),
				Size:     mediaPeerLink.Size(),
			})
		}
	}

	return enclosures
}

func (r *rssItem) entryCommentsURL() string {
	for _, commentLink := range r.CommentLinks {
		if commentLink.XMLName.Space == "" {
			commentsURL := strings.TrimSpace(commentLink.Data)
			// The comments URL is supposed to be absolute (some feeds publishes incorrect comments URL)
			// See https://cyber.harvard.edu/rss/rss.html#ltcommentsgtSubelementOfLtitemgt
			if url.IsAbsoluteURL(commentsURL) {
				return commentsURL
			}
		}
	}

	return ""
}

func isValidLinkRelation(rel string) bool {
	switch rel {
	case "", "alternate", "enclosure", "related", "self", "via":
		return true
	default:
		if strings.HasPrefix(rel, "http") {
			return true
		}
		return false
	}
}
First commit 2017-11-20 06:10:04 +01:00			`// Copyright 2017 Frédéric Guillot. All rights reserved.`
			`// Use of this source code is governed by the Apache 2.0`
			`// license that can be found in the LICENSE file.`

Use canonical imports 2018-08-25 06:51:50 +02:00			`package rss // import "miniflux.app/reader/rss"`
First commit 2017-11-20 06:10:04 +01:00
			`import (`
			`"encoding/xml"`
Add workaround for entry title with double encoded entities Example: &#39;Text&#39; 2021-02-13 22:26:55 +01:00			`"html"`
First commit 2017-11-20 06:10:04 +01:00			`"path"`
			`"strconv"`
			`"strings"`
			`"time"`

Use canonical imports 2018-08-25 06:51:50 +02:00			`"miniflux.app/crypto"`
			`"miniflux.app/logger"`
			`"miniflux.app/model"`
			`"miniflux.app/reader/date"`
Add support of media elements for Atom feeds 2019-11-29 08:47:53 +01:00			`"miniflux.app/reader/media"`
Use canonical imports 2018-08-25 06:51:50 +02:00			`"miniflux.app/reader/sanitizer"`
			`"miniflux.app/url"`
Handle RSS feeds without entry links 2017-11-21 00:15:10 +01:00			`)`
First commit 2017-11-20 06:10:04 +01:00
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`// Specs: https://cyber.harvard.edu/rss/rss.html`
Handle RSS feeds without entry links 2017-11-21 00:15:10 +01:00			`type rssFeed struct {`
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			XMLName xml.Name `xml:"rss"`
			Version string `xml:"version,attr"`
			Title string `xml:"channel>title"`
			Links []rssLink `xml:"channel>link"`
			Language string `xml:"channel>language"`
			Description string `xml:"channel>description"`
			PubDate string `xml:"channel>pubDate"`
			ManagingEditor string `xml:"channel>managingEditor"`
			Webmaster string `xml:"channel>webMaster"`
			Items []rssItem `xml:"channel>item"`
			`PodcastFeedElement`
			`}`

Handle invalid feeds with relative URLs 2020-12-03 05:47:11 +01:00			`func (r rssFeed) Transform(baseURL string) model.Feed {`
			`var err error`

Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`feed := new(model.Feed)`

Handle invalid feeds with relative URLs 2020-12-03 05:47:11 +01:00			`siteURL := r.siteURL()`
			`feed.SiteURL, err = url.AbsoluteURL(baseURL, siteURL)`
			`if err != nil {`
			`feed.SiteURL = siteURL`
			`}`

			`feedURL := r.feedURL()`
			`feed.FeedURL, err = url.AbsoluteURL(baseURL, feedURL)`
			`if err != nil {`
			`feed.FeedURL = feedURL`
			`}`

			`feed.Title = strings.TrimSpace(r.Title)`
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`if feed.Title == "" {`
			`feed.Title = feed.SiteURL`
			`}`

			`for _, item := range r.Items {`
			`entry := item.Transform()`
			`if entry.Author == "" {`
			`entry.Author = r.feedAuthor()`
			`}`

			`if entry.URL == "" {`
			`entry.URL = feed.SiteURL`
			`} else {`
			`entryURL, err := url.AbsoluteURL(feed.SiteURL, entry.URL)`
			`if err == nil {`
			`entry.URL = entryURL`
			`}`
			`}`

			`if entry.Title == "" {`
			`entry.Title = entry.URL`
			`}`

			`feed.Entries = append(feed.Entries, entry)`
			`}`

			`return feed`
			`}`

			`func (r *rssFeed) siteURL() string {`
			`for _, element := range r.Links {`
			`if element.XMLName.Space == "" {`
			`return strings.TrimSpace(element.Data)`
			`}`
			`}`

			`return ""`
			`}`

			`func (r *rssFeed) feedURL() string {`
			`for _, element := range r.Links {`
			`if element.XMLName.Space == "http://www.w3.org/2005/Atom" {`
			`return strings.TrimSpace(element.Href)`
			`}`
			`}`

			`return ""`
			`}`

			`func (r rssFeed) feedAuthor() string {`
			`author := r.PodcastAuthor()`
			`switch {`
			`case r.ManagingEditor != "":`
			`author = r.ManagingEditor`
			`case r.Webmaster != "":`
			`author = r.Webmaster`
			`}`
Do not strip tags for entry title Some technical blogs have titles like "</some-title>" or "This is some <code>source code</code>". Miniflux was removing these elements which prevent rendering the title correctly. 2021-01-03 20:33:10 +01:00			`return sanitizer.StripTags(strings.TrimSpace(author))`
First commit 2017-11-20 06:10:04 +01:00			`}`

Handle RSS feeds without entry links 2017-11-21 00:15:10 +01:00			`type rssLink struct {`
			`XMLName xml.Name`
			Data string `xml:",chardata"`
			Href string `xml:"href,attr"`
Handle RSS entries with Atom links 2017-11-21 00:48:26 +01:00			Rel string `xml:"rel,attr"`
Handle RSS feeds without entry links 2017-11-21 00:15:10 +01:00			`}`

Get the right comments URL when having multiple namespaces 2018-04-10 05:30:55 +02:00			`type rssCommentLink struct {`
			`XMLName xml.Name`
			Data string `xml:",chardata"`
			`}`

Rename RSS parser getters 2018-04-10 05:38:12 +02:00			`type rssAuthor struct {`
			`XMLName xml.Name`
			Data string `xml:",chardata"`
			Name string `xml:"name"`
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			Email string `xml:"email"`
Rename RSS parser getters 2018-04-10 05:38:12 +02:00			Inner string `xml:",innerxml"`
			`}`

Ignore <media:title> in RSS 2.0 feeds In the vast majority of cases, the default entry title is correct. Ignoring <media:title> avoid overriding the default title if they are different. 2020-06-30 03:08:19 +02:00			`type rssTitle struct {`
			`XMLName xml.Name`
			Data string `xml:",chardata"`
			Inner string `xml:",innerxml"`
			`}`

Rename RSS parser getters 2018-04-10 05:38:12 +02:00			`type rssEnclosure struct {`
			URL string `xml:"url,attr"`
			Type string `xml:"type,attr"`
			Length string `xml:"length,attr"`
			`}`

Add support of media elements for RSS 2 feeds 2019-11-29 06:21:00 +01:00			`func (enclosure *rssEnclosure) Size() int64 {`
			`if enclosure.Length == "" {`
			`return 0`
			`}`
			`size, _ := strconv.ParseInt(enclosure.Length, 10, 0)`
			`return size`
			`}`

Handle RSS feeds without entry links 2017-11-21 00:15:10 +01:00			`type rssItem struct {`
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			GUID string `xml:"guid"`
Ignore <media:title> in RSS 2.0 feeds In the vast majority of cases, the default entry title is correct. Ignoring <media:title> avoid overriding the default title if they are different. 2020-06-30 03:08:19 +02:00			Title []rssTitle `xml:"title"`
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			Links []rssLink `xml:"link"`
			Description string `xml:"description"`
			PubDate string `xml:"pubDate"`
			Authors []rssAuthor `xml:"author"`
			CommentLinks []rssCommentLink `xml:"comments"`
			EnclosureLinks []rssEnclosure `xml:"enclosure"`
			`DublinCoreElement`
			`FeedBurnerElement`
			`PodcastEntryElement`
Add support of media elements for Atom feeds 2019-11-29 08:47:53 +01:00			`media.Element`
First commit 2017-11-20 06:10:04 +01:00			`}`

Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`func (r rssItem) Transform() model.Entry {`
			`entry := new(model.Entry)`
			`entry.URL = r.entryURL()`
			`entry.CommentsURL = r.entryCommentsURL()`
			`entry.Date = r.entryDate()`
			`entry.Author = r.entryAuthor()`
			`entry.Hash = r.entryHash()`
			`entry.Content = r.entryContent()`
			`entry.Title = r.entryTitle()`
			`entry.Enclosures = r.entryEnclosures()`
			`return entry`
First commit 2017-11-20 06:10:04 +01:00			`}`
Improve feed parsers 2017-11-22 23:52:31 +01:00
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`func (r *rssItem) entryDate() time.Time {`
Handle RSS entries with Atom links 2017-11-21 00:48:26 +01:00			`value := r.PubDate`
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`if r.DublinCoreDate != "" {`
			`value = r.DublinCoreDate`
First commit 2017-11-20 06:10:04 +01:00			`}`

			`if value != "" {`
			`result, err := date.Parse(value)`
			`if err != nil {`
Handle various invalid date 2020-11-17 06:31:39 +01:00			`logger.Error("rss: %v (entry GUID = %s)", err, r.GUID)`
First commit 2017-11-20 06:10:04 +01:00			`return time.Now()`
			`}`

			`return result`
			`}`

			`return time.Now()`
			`}`

Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`func (r *rssItem) entryAuthor() string {`
			`author := ""`

			`for _, rssAuthor := range r.Authors {`
			`switch rssAuthor.XMLName.Space {`
			`case "http://www.itunes.com/dtds/podcast-1.0.dtd", "http://www.google.com/schemas/play-podcasts/1.0":`
			`author = rssAuthor.Data`
			`case "http://www.w3.org/2005/Atom":`
			`if rssAuthor.Name != "" {`
			`author = rssAuthor.Name`
			`} else if rssAuthor.Email != "" {`
			`author = rssAuthor.Email`
			`}`
			`default:`
			`if rssAuthor.Name != "" {`
			`author = rssAuthor.Name`
			`} else {`
			`author = rssAuthor.Inner`
			`}`
First commit 2017-11-20 06:10:04 +01:00			`}`
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`}`
First commit 2017-11-20 06:10:04 +01:00
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`if author == "" {`
			`author = r.DublinCoreCreator`
First commit 2017-11-20 06:10:04 +01:00			`}`

Do not strip tags for entry title Some technical blogs have titles like "</some-title>" or "This is some <code>source code</code>". Miniflux was removing these elements which prevent rendering the title correctly. 2021-01-03 20:33:10 +01:00			`return sanitizer.StripTags(strings.TrimSpace(author))`
First commit 2017-11-20 06:10:04 +01:00			`}`

Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`func (r *rssItem) entryHash() string {`
			`for _, value := range []string{r.GUID, r.entryURL()} {`
First commit 2017-11-20 06:10:04 +01:00			`if value != "" {`
Rename helper packages 2018-01-03 04:15:08 +01:00			`return crypto.Hash(value)`
First commit 2017-11-20 06:10:04 +01:00			`}`
			`}`

			`return ""`
			`}`

Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`func (r *rssItem) entryTitle() string {`
Ignore <media:title> in RSS 2.0 feeds In the vast majority of cases, the default entry title is correct. Ignoring <media:title> avoid overriding the default title if they are different. 2020-06-30 03:08:19 +02:00			`var title string`

			`for _, rssTitle := range r.Title {`
			`switch rssTitle.XMLName.Space {`
			`case "http://search.yahoo.com/mrss/":`
			`// Ignore title in media namespace`
			`case "http://purl.org/dc/elements/1.1/":`
			`title = rssTitle.Data`
			`default:`
			`title = rssTitle.Data`
			`}`

			`if title != "" {`
			`break`
			`}`
			`}`

Add workaround for entry title with double encoded entities Example: &#39;Text&#39; 2021-02-13 22:26:55 +01:00			`return html.UnescapeString(strings.TrimSpace(title))`
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`}`
First commit 2017-11-20 06:10:04 +01:00
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`func (r *rssItem) entryContent() string {`
			`for _, value := range []string{r.DublinCoreContent, r.Description, r.PodcastDescription()} {`
			`if value != "" {`
			`return value`
			`}`
			`}`
			`return ""`
First commit 2017-11-20 06:10:04 +01:00			`}`

Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`func (r *rssItem) entryURL() string {`
			`if r.FeedBurnerLink != "" {`
			`return r.FeedBurnerLink`
Handle RSS entries with Atom links 2017-11-21 00:48:26 +01:00			`}`

			`for _, link := range r.Links {`
			`if link.XMLName.Space == "http://www.w3.org/2005/Atom" && link.Href != "" && isValidLinkRelation(link.Rel) {`
Improve feed parsers 2017-11-22 23:52:31 +01:00			`return strings.TrimSpace(link.Href)`
Handle RSS entries with Atom links 2017-11-21 00:48:26 +01:00			`}`

			`if link.Data != "" {`
Improve feed parsers 2017-11-22 23:52:31 +01:00			`return strings.TrimSpace(link.Data)`
Handle RSS entries with Atom links 2017-11-21 00:48:26 +01:00			`}`
First commit 2017-11-20 06:10:04 +01:00			`}`

Handle RSS entries with Atom links 2017-11-21 00:48:26 +01:00			`return ""`
First commit 2017-11-20 06:10:04 +01:00			`}`

Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`func (r *rssItem) entryEnclosures() model.EnclosureList {`
First commit 2017-11-20 06:10:04 +01:00			`enclosures := make(model.EnclosureList, 0)`
Add support of media elements for RSS 2 feeds 2019-11-29 06:21:00 +01:00			`duplicates := make(map[string]bool, 0)`

Add support of media elements for Atom feeds 2019-11-29 08:47:53 +01:00			`for _, mediaThumbnail := range r.AllMediaThumbnails() {`
Add support of media elements for RSS 2 feeds 2019-11-29 06:21:00 +01:00			`if _, found := duplicates[mediaThumbnail.URL]; !found {`
			`duplicates[mediaThumbnail.URL] = true`
			`enclosures = append(enclosures, &model.Enclosure{`
			`URL: mediaThumbnail.URL,`
Add support of media elements for Atom feeds 2019-11-29 08:47:53 +01:00			`MimeType: mediaThumbnail.MimeType(),`
			`Size: mediaThumbnail.Size(),`
Add support of media elements for RSS 2 feeds 2019-11-29 06:21:00 +01:00			`})`
			`}`
			`}`
First commit 2017-11-20 06:10:04 +01:00
Rename RSS parser getters 2018-04-10 05:38:12 +02:00			`for _, enclosure := range r.EnclosureLinks {`
Handle RSS feeds without entry links 2017-11-21 00:15:10 +01:00			`enclosureURL := enclosure.URL`
First commit 2017-11-20 06:10:04 +01:00
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`if r.FeedBurnerEnclosureLink != "" {`
			`filename := path.Base(r.FeedBurnerEnclosureLink)`
First commit 2017-11-20 06:10:04 +01:00			`if strings.Contains(enclosureURL, filename) {`
Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`enclosureURL = r.FeedBurnerEnclosureLink`
First commit 2017-11-20 06:10:04 +01:00			`}`
			`}`

Ignore enclosures without URL 2020-01-31 06:08:11 +01:00			`if enclosureURL == "" {`
			`continue`
			`}`

Add support of media elements for RSS 2 feeds 2019-11-29 06:21:00 +01:00			`if _, found := duplicates[enclosureURL]; !found {`
			`duplicates[enclosureURL] = true`

			`enclosures = append(enclosures, &model.Enclosure{`
			`URL: enclosureURL,`
			`MimeType: enclosure.Type,`
			`Size: enclosure.Size(),`
			`})`
			`}`
			`}`

Add support of media elements for Atom feeds 2019-11-29 08:47:53 +01:00			`for _, mediaContent := range r.AllMediaContents() {`
Add support of media elements for RSS 2 feeds 2019-11-29 06:21:00 +01:00			`if _, found := duplicates[mediaContent.URL]; !found {`
			`duplicates[mediaContent.URL] = true`
			`enclosures = append(enclosures, &model.Enclosure{`
			`URL: mediaContent.URL,`
			`MimeType: mediaContent.MimeType(),`
			`Size: mediaContent.Size(),`
			`})`
			`}`
First commit 2017-11-20 06:10:04 +01:00			`}`

Add support of media elements for Atom feeds 2019-11-29 08:47:53 +01:00			`for _, mediaPeerLink := range r.AllMediaPeerLinks() {`
			`if _, found := duplicates[mediaPeerLink.URL]; !found {`
			`duplicates[mediaPeerLink.URL] = true`
			`enclosures = append(enclosures, &model.Enclosure{`
			`URL: mediaPeerLink.URL,`
			`MimeType: mediaPeerLink.MimeType(),`
			`Size: mediaPeerLink.Size(),`
			`})`
			`}`
			`}`

First commit 2017-11-20 06:10:04 +01:00			`return enclosures`
			`}`

Improve Podcast support (iTunes and Google Play feeds) - Add support for Google Play XML namespace - Improve existing iTunes namespace implementation 2019-12-23 22:29:53 +01:00			`func (r *rssItem) entryCommentsURL() string {`
Get the right comments URL when having multiple namespaces 2018-04-10 05:30:55 +02:00			`for _, commentLink := range r.CommentLinks {`
			`if commentLink.XMLName.Space == "" {`
Allow only absolute URLs in comments URL Some feeds are using invalid URLs (random text). 2020-01-05 00:18:24 +01:00			`commentsURL := strings.TrimSpace(commentLink.Data)`
			`// The comments URL is supposed to be absolute (some feeds publishes incorrect comments URL)`
			`// See https://cyber.harvard.edu/rss/rss.html#ltcommentsgtSubelementOfLtitemgt`
			`if url.IsAbsoluteURL(commentsURL) {`
			`return commentsURL`
			`}`
Get the right comments URL when having multiple namespaces 2018-04-10 05:30:55 +02:00			`}`
			`}`

			`return ""`
			`}`

Handle RSS entries with Atom links 2017-11-21 00:48:26 +01:00			`func isValidLinkRelation(rel string) bool {`
			`switch rel {`
			`case "", "alternate", "enclosure", "related", "self", "via":`
			`return true`
			`default:`
			`if strings.HasPrefix(rel, "http") {`
			`return true`
			`}`
			`return false`
			`}`
			`}`